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Предисловие 


В погоне за счастьем 


Рей - язык, с помощью которого вы сделаете свою работу. 


Конечно, если эта работа — программирование, то теоретически ее можно сделать 
с помощью любого «полного» компьютерного языка. Но опыт показывает, что 
компьютерные языки различаются не столько возможностью что-либо сделать, 
сколько легкостью, с которой это достигается. На одном полюсе находятся так 
называемые языки четвертого поколения, с помощью которых можно легко де- 
лать одни вещи и почти невозможно другие. На другом полюсе – так называемые 
языки с промышленными возможностями (іпаџѕёгіа[-ѕігепеіћ Іапсоиарсеѕ), по- 
средством которых одинаково трудно делать почти все. 


Ре! не таков. Если сказать кратко, по задумке его создателей на этом языке лег- 
ко решать простые задачи. сохраняя возможность решать и сложные. 


Что это за «простые задачи», которые должны решаться легко? Разумеется, те, 
которые мы решаем изо дня в день. Нам нужен язык, с помощью которого легко 
работать с числами и текстом, файлами и каталогами, компьютерами и сетями, 
а в особенности - с программами. Он должен позволять легко запускать внешние 
программы и просматривать результаты их работы в поисках интересных дан- 
ных. Он должен позволять легко отправлять эти интересные данные другим про- 
граммам, способным обрабатывать их особым образом. Он должен также позво- 
лять нам легко разрабатывать собственные программы, изменять их и произво- 
дить отладку. И конечно, наши собственные программы должны легко компили: 
роваться и запускаться, а также быть переносимыми на любую современную 
операционную систему. 


Все это, а также многое другое делает Рег]. 


Первоначально разработанный как интегрирующий язык для ОМХ, Ре! давно 
распространился на большинство других операционных систем. Поскольку Ре] 
выполняется почти везде, он является одной из наиболее переносимых сред про- 
граммирования, существующих сегодня. Чтобы писать переносимые программы 
на С или С++, необходимо расставить все эти странные пометки #1ѓ0еї для каж- 
дой операционной системы. Для обеспечения переносимости программ на Јауа 
нужно разбираться в индивидуальных особенностях всех реализаций этой плат- 
формы. Для создания переносимых сценариев командной оболочки нужно пом- 
нить синтаксис всех команд для каждой версии операционной системы и пытать- 
ся найти общий знаменатель, благодаря которому они, как можно надеяться, 
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будут работать всюду. А чтобы создавать переносимые программы на Уіѕиа] Ва- 
ѕіс, потребуется дать более гибкое определение понятия «переносимость». :-) 


Рег] позволяет нам счастливо избежать таких проблем, сохраняя при этом многие 
преимущества других языков и добавляя собственные чудеса. У этих чудес много 
источников: практичность набора функций Регі, изобретательность сообщества 
Рен и неистребимый энтузиазм движения ореп зоигсе в целом. Однако в значи- 
тельной мере чудеса обусловлены гибридной природой Рен. У Рег смешанное 
происхождение, и многообразие средств в этом языке всегда считалось плюсом, 
а не слабостью. Рег| - это язык, говорящий: «Дайте мне ваших усталых, ваших 
бедных». Если вы чувствуете себя словно в теснящейся толпе и стремитесь «ды- 
шать свободно», то Ре!| – для вас. 


Рег] охватывает различные культуры. Его взрывное распространение в значитель- 
ной мере питалось стремлением бывших системных ОМІХ-программистов взять 
с собой как можно больше из «старого мира». Для них Регі является переносимой 
квинтэссенцией культуры ОМХ, оазисом в пустыне «невозможности перейти из 
одного места в другое». Существует, однако, и движение в обратном направле- 
нии: веб-дизайнеры, работающие в МілаӢомз, с удовольствием обнаруживают воз- 
можность запускать свои Рег-программы на ОМІХ-сервере своей компании без 
доработки. 


Хотя Рен особенно популярен среди системных программистов и веб-разработчи- 
ков, это связано лишь с тем, что они первыми его открыли; аудитория Рег! значи- 
тельно шире. Получив при создании скромный статус языка обработки текста, 
Ре! развился в сложный язык программирования общего назначения с богатой 
средой разработки программ, укомплектованной отладчиками, профилировщи- 
ками, компоновщиками, компиляторами, библиотеками, редакторами с подсвет- 
кой синтаксиса и другими атрибутами «настоящего» языка программирования — 
если они вам требуются. Но все они относятся к поддержке возможностей реше- 
ния сложных задач, с чем справляются многие другие языки. Уникальность Ре] 
в том, что он никогда не отступал от идеи легких решений для простых задач. 


Поскольку Ре является одновременно мощным и доступным средством, он по- 
стоянно используется во всех мыслимых сферах — от аэрокосмической техники 
до молекулярной биологии, от математики до лингвистики, от графики до обра- 
ботки документов, от управления базами данных до сетевого администрирова- 
ния. Ре! используется теми, кому позарез нужно быстро проанализировать или 
преобразовать большие объемы данных, будь то последовательность генов ДНК, 
набор веб-страниц или контракты на поставку свинины. 


Существует много слагаемых успеха этого языка. Ре! как открытый проект стал 
успешным еще до того, как движение ореп зоигсе получило свое название. Регі 
свободно распространяется, и так будет всегда. Каждый может работать с Рег 
так, как сочтет удобным, и на основе очень либеральной политики лицензирова- 
ния. Если вы занимаетесь коммерческой деятельностью и хотите воспользовать- 
ся Регі, можете приступать. Язык Ре! разрешается встраивать в коммерческие 
приложения бесплатно и без ограничений. А для тех, у кого возникнет проблема, 


1 _ «С1уете уопг гед, уоцг роог, Уоиг Би е4 таззез уеагпіпе ёо Бгеа{ Те їгее...» — эти сло- 
ва являются частью текста стихотворения, выбитого на табличке, которая находится 
в помещении внутри пьедестала Статуи Свободы. См. фото таблички по адресу ВИр:// 
еп.шіЕірейіа.оге/иікі/Тће_ Меш Соіоѕвиѕ. — Прим. ред. 
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которую сообщество Ре! не сможет решить, существует безотказная страховка — 
сам исходный код. Сообщество Рег] не занимается продажей своих профессио- 
нальных тайн под видом «обновлений». Сообщество Ре! никогда не «выйдет из 
дела» и не оставит вас с брошенным на произвол судьбы продуктом. 


Безусловно, популярности Рег]! способствует его бесплатное распространение. Но 
этого недостаточно для объяснения феномена Рей, поскольку большой успех при- 
ходит далеко не ко всем бесплатно распространяемым пакетам. Дело не в том, что 
он бесплатен; он доставляет удовольствие. Люди чувствуют желание творить на 
Рег, поскольку он дает свободу самовыражения: можно выбирать между целями 
оптимизации — скоростью работы компьютера или скоростью программирования, 
между многословием и выразительностью, между «читабельностью» и простотой 
поддержки или повторного использования, или переносимости, или простотой 
изучения, или поучительностью. Можно оптимизировать даже непонятность, ес- 
ли принять участие в конкурсе на самую непонятную программу – Ођѓиѕсаќе 
Рей Сопіев+. 


Рег способен предоставить все эти степени свободы, поскольку является языком 
с раздвоением личности. Это одновременно и очень простой, и очень богатый 
язык. Ре заимствует лучшие идеи практически отовсюду и объединяет их в про- 
стую логическую систему. Для тех, кому он просто нравится, Рег! - это РгасНса! 
Ехігасіїоп апа Верогі Гапвиаве (практический язык извлечения данных и созда- 
ния отчетов). Для тех, кто любит его, Ре! – это Раѓћоіодісайу Ечеснс ВибЫзЁ 
Ііѕіег (паталогически эклектичный язык для распечатки чепухи). А минимали- 
стам Рей кажется проявлением бесцельной избыточности. Но это хорошо. Редук- 
ционисты должны существовать (в основном среди физиков). Редукционисты 
стремятся разъять целое на части. Мы, все остальные, просто пытаемся собрать 
целое из частей. 


Во многих отношениях Ре! — простой язык. Не требуется знать множество осо- 
бых заклинаний, чтобы скомпилировать программу на Рег! — ее можно просто 
выполнить как пакетный файл или сценарий оболочки. Типы и структуры Рег] 
просты в использовании и понимании. Рен не налагает свои произвольные огра- 
ничения на данные - строки и массивы могут быть сколь угодно велики, лишь бы 
хватило оперативной памяти, и их организация позволяет им легко увеличивать- 
ся по мере надобности. Рей не требует изучения новых синтаксиса и семантики, 
в значительной мере заимствуя их из других языков, с которыми вы можете быть 
знакомы (например, С, ашё, ВАЅІС, Руіћоп, английский и греческий). На прак- 
тике почти любой программист сможет прочесть хорошо написанный код на Рег] 
и составить себе представление о том, что он делает. 


Очень важно, что нет необходимости изучать Рег полностью, чтобы начать пи- 
сать полезные программы. Изучение Рег! можно начать с «тонкого конца». Вы 
можете программировать на Рег! версии «Детский Лепет», и мы обещаем не сме 
яться над этим. Точнее, мы обещаем смеяться не более чем над первыми попыт- 
ками ребенка творчески подходить к миру. Многие идеи Рей заимствованы из 
естественного языка, и одна из лучших его черт состоит в том, что он позволяет 
использовать лишь подмножество языка, если его достаточно, чтобы передать 
мысль. В культуре Рей приемлема любая степень владения языком. Полицию по 
охране языка мы к вам не пришлем. Сценарий Рег! будет «правильным», если вы- 
полнит задачу прежде, чем начальник вас уволит. 
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Будучи во многих отношениях простым, Рен является и богатым языком, в кото- 
ром можно долго совершенствоваться. Это расплата за возможность решать слож- 
ные задачи. Хотя понадобится некоторое время на освоение всех средств Ре], вы 
будете рады иметь в своем распоряжении расширенные возможности, когда они 
вдруг понадобятся. 


Благодаря своему происхождению Рег1 был богатым языком уже тогда, когда счи- 
тался «просто» языком преобразования данных, предназначенным для ориенти- 
рования в файлах, просмотра больших объемов текста, создания и получения ди- 
намических данных и вывода легко форматируемых отчетов, основанных на этих 
данных. Но в какой-то момент начался расцвет Реп. Он стал также и языком для 
работы с файловой системой, управления процессами, администрирования баз 
данных, программирования в архитектуре клиент-сервер, создания безопасных 
программ, управления данными в Сети и даже для объектно-ориентированного 
и функционального программирования. Эти возможности не были просто меха- 
нически присоединены к Рен - каждая новая синергически работает с остальны- 
ми, поскольку с самого начала Рег! проектировался как интегрирующий язык. 


Но Рей умеет объединять в единое целое не только собственные функции. Он соз- 
давался как модульный, расширяемый язык. Рен позволяет быстро проектиро- 
вать, программировать, отлаживать и разворачивать приложения, а также без 
труда расширять функциональные возможности этих приложений при необходи- 
мости. Ре] можно встраивать в другие языки, а другие языки можно встраивать 
в Рег]. С помощью механизма импорта модулей можно использовать эти внеш- 
ние определения, как если бы они были встроенными функциями Регі. Объект- 
но-ориентированные внешние библиотеки сохраняют свою объектную ориенти- 
рованность в Рег]. 


Ре помогает разработчику и в других отношениях. В отличие от строго интер- 
претируемых языков, таких как командные файлы и сценарии оболочки, кото- 
рые компилируют и выполняют лишь одну команду за раз, Ре! сначала быстро 
компилирует всю программу в промежуточный формат. Подобно любому другому 
компилятору, он осуществляет различного вида оптимизации и мгновенно реаги- 
рует на любые ошибки ~ от синтаксических и семантических до неудачи при свя- 
зывании с библиотеками. Когда компилирующий интерфейс Рег! удовлетворен 
вашей программой, он передает промежуточный код на выполнение интерпрета- 
тору (либо какому-либо из нескольких модулей генераторов, способных создавать 
текст на С или байт-код). Все это выглядит сложным, однако компилятор и интер- 
претатор работают весьма эффективно, и обычный цикл компиляции-прогона-ис- 
правления занимает считанные секунды. В совокупности с мощной поддержкой 
амортизации отказов столь короткий цикл делает Ре! языком, на котором дей- 
ствительно возможно быстрое прототипирование. Позже, по ходу совершенство- 
вания программы, вы сможете повысить требования к себе и программировать 
больше за счет дисциплины, чем за счет интуиции. Рег] и в этом окажет содейст- 
вие, если его вежливо об этом попросить. 


Регі также способствует созданию более защищенных программ. Помимо всех 
обычных интерфейсов защиты, предоставляемых другими языками, Рег! защи- 
щает от случайных ошибок в системе безопасности посредством уникального ме- 
ханизма трассировки данных, автоматически определяющего данные, которые 
поступили из ненадежного источника, и предотвращающего выполнение опасных 
операций. Наконец, Рег| позволяет создавать специальные защищенные отсеки, 
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в которых можно безопасно выполнять код сомнительного происхождения с огра- 
ничением опасных операций. 


Парадоксально, но самая большая помощь, которую Рег] может оказать програм- 
мисту, связана не столько с языком Регі, сколько с людьми, которые с ним рабо- 
тают. Скажем откровенно, сообщество Рег] составляют люди. которые более чем 
кто-либо другой готовы прийти на помощь. Если считать, что в движении Рег 
есть что-то благочестивое, то именно это и есть его основная ценность. Ларри хо- 
тел, чтобы сообщество было чем-то вроде рая, ив целом его желание пока осущест- 
влнется. Внесите и свой вклад, чтобы оно таким и оставалось. 


Изучаете ли вы Регі ради спасения мира, или из любопытства, или по приказу 
вашего начальника — в любом случае этот учебник позволит освоить как основы, 
так и сложные вопросы. И хотя мы не намереваемся учить вас программирова- 
нию, проницательный читатель что-то приобрезет как от искусства, так и от нау- 
ки программирования. Мы рекомендуем вам развивать в себе три великие добро- 
детели программиста: лень, нетерпеливость и высокомерие (Іагіпеѕѕ, ітраііепсе, 
һифгіѕ). Мы надеемся, что, читая эту книгу, вы найдете ее местами довольно за- 
нимательной (а местами – крайне занимательной). Если этого окажется недоста- 
точно, чтобы вы не заснули, постоянно напоминайте себе, что изучение Рег] по- 
высит ценность вашего резюме. Так что читайте лальше. 


Что нового в этом издании 


Проще сказать, что старого! Прошло достаточно много времени с момента выхода 
предыдущего издания. В свое оправдание мы можем лишь сказать, что у нас бы- 
ла на то пара причин, но теперь все в порядке. 


Третье издание вышло в середине 2000 года, как раз когда вышла версия Реп 5.6. 
Когда мы пишем эти строки 12 лет спустя, к выходу готовится версия Ре! 5.16. 
Много воды утекло за эти годы: вышло несколько новых версий Рег] 5 и случи- 
лось маленькое событие, которое мы называем Рей 6. Однако эта шестерка об- 
манчива. В действительности, Ре! 6 – это «младший брат» Рен 5, а не важное об- 
новление Регі 5, как можно было бы заключить из номера версии. Но в этой книге 
не рассказывается об этом другом языке. Она все еще посвящена Регі 5 - версии, 
которой вполне успешно пользуется большинство людей во всем мире (и даже 
парни из проекта Ре] 6!).! 


Чтобы рассказать, что нового в этой книге, придется рассказать, что нового в Реті. 
Это издание - не просто «косметический ремонт», призванный повысить продажи 
книги. Это долгожданное обновление описания языка, продолжавшего активно 
развиваться в течение последних пяти лет. Мы не будем перечислять все измене- 
ния (при необходимости обратитесь к страницам рейаейа), но есть кое-что, о чем 
нам хотелось бы рассказать отдельно. 


В Рег] 5 мы начали добавлять новые функциональные возможности, одновремен- 
но создавая средства защиты старых программ от новых инструкций. Например, 


1 Поскольку мы ленивы, а вы уже знаете, что эта книга посвящена Регі 5, следует упомя- 
нуть, что мы не всегда будем точно указывать номер версии «Рей у5.п» — в оставшейся 
части книги, если вы увидите лишь номер версии, начинающийся с «у5», просто знай- 
те, что речь идет об этой версии Рег]. 
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мы наконец смягчились в отношении частых просьб реализовать инструкцию, 
подобную инструкции зи (сн. Однако, как это принято в мире Рен, мы сделали ее 
лучше и удобнее, предоставив вам более полный контроль над тем, что вы делае- 
те. Мы назвали ее діуеп-мһеп, но эта инструкция будет доступна, только если вы 
явно попросите об этом. Любая из следующих директив включает достуг к этой 
новой возможности: 


иѕе м5. 10; 
изе Реафиге 9м(ѕміїсһ); 
изе Реафиге 9м(:5. 10); 


а включив ее, вы получаете «заряженный» оператор ѕиіїсћ: 


91\%еп ($1%емт) { 
мһеп (/а/) { зау “МатсНеф ап а” } 
мћеп (/бее/) { ѕау “Матснед а оее’ } 
} 


В главе 4 вы познакомитесь поближе с этой и другими новыми особенностями, 
так как там их обсуждение более уместно. 


Даже при том что поддержка стандарта Юникод (Оплсоде) существует в Рей начи- 
ная с версии у5.6, она была значительно улучшена в последних версиях. В частно: 
сти, это касается более полной, чем в других языках программированин на дан- 
ный момент, поддержки Юникода в регулярных выражениях. Благодаря посто- 
янному улучшению поддержки этого стандарта Ре иной раз используется даже 
для испытаний будущих наработок «Консорциума Юникода». В предыдущем из- 
дании этой книги весь материал, посвященный Юникоду, уместился в единст- 
венной главе, а в этом издании обсуждение этой темы встречается везде, где это 
уместно. 


Стали еще лучше регулярные выражения – одна из особенностей, устойчиво ас- 
социирующихся у программистов именно с языком Регі. Другие языки заимство- 
вали язык шаблонов из Ре! и дали ему название Ре СотрайЫе Вещаг Ехргез- 
ѕіопѕ (регулярные выражения, совместимые с Ре!]), но при этом добавили некото: 
рые свои особенности. Мы, в свою очередь, заимствовали некоторые из этих осо: 
бенностей, продолжая традицию вбирать в Рег! все самое лучшее отовсюду. Вы 
также познакомитесь с мощными новыми функциями для работы с Юникодом 
в шаблонах регулярных выражений. 


Потоки выполнения (#һгеайѕ) также претерпели значительные изменения. Рег] 
поддерживает две модели многопоточного выполнения: одну мы назвали 5005їћге- 
айѕ (по номеру версии, в которой она была добавлена), а другая ~ потоки интер- 
‘претатора. Начиная с версии у5.10 поддерживаются только потоки интерпрета: 
тора. Однако по различным причинам мы решили не включать обсуждение этой 
темы в книгу, а больше внимания уделить другим особенностям. Если у вас по- 
явится желание изучить потоки выполнения, обратитесь к странице регЁйгия 
справочного руководства!, которая содержит практически все, что мы могли бы 
поместить в главу, описывающую потоки выполнения. Возможно, в будущем мы 
добавим эту главу в качестве бесплатного приложения. 


1 Доступ к соответствующим страницам можно получить при помощи команды ре ос 
регіћгіиі или по адресу ВИр://рей4ос.рейт.-отЕ/регёйгния. ту. – Прим. ред. 
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С течением времени одни особенности появлялись, другие исчезали. Некоторые 
экспериментальные особенности оказывались неудачными, и мы заменяли их 
другими экспериментальными особенностями. Так были убраны и забыты псев- 
дохеши!. Если вы не знаете, что это такое, не переживайте об этом и не ищите их 
в этом издании. 


И еще: с момента последнего обновления этой книги произошла крупная револю- 
ция (или две) в практике программирования на Регі, как и в культуре тестирова- 
ния. Архив СРАМ (Сотргеһепзіуе Ре Агсһіуе МебмогЕ — обширный сетевой ар- 
хив ресурсов для Рек) продолжает свой экспоненциальный рост, что делает его 
«убойной особенностью» Рей. Хотя эта книга и не об архиве СРАМ, мы все же бу- 
дем рассказывать о некоторых модулях из него, когда это потребуется. Не пытай- 
тесь реализовать все на голом Регі, без использования дополнительных модулей. 


Мы исключили из этого издания две главы: список модулей стандартной библио- 
теки и список диагностических сообщений (главы 32 и 33 в предыдущем издании). 
Обе они устареют еще до того, как эта книга попадет на вашу книжную полку. Мы 
расскажем вам, как самостоятельно получить этот список. Что касается диагно- 
стических сообщений, их можно найти на странице ре|Фав справочного руковод: 
ства? или включить вывод подробных предупреждений прагмой біадпоѕіісѕ. 


Часть І «Общий обзор» 


Начать всегда труднее всего. В этой части базовые идеи Ре! излагаются в не- 
формальном виде – устройтесь поудобнее в вашем любимом кресле. Не претен- 
дуя на роль полного учебного руководства, эта часть предлагает скоростное 
введение в Регі, что устроит не всякого читателя. В разделе «Печатная доку- 
ментация» (ниже) поищите книги, которые лучше сочетаются с вашим сти- 
лем учебы. 


Часть П «Анатомия Рей» 


В этой части проводится глубокое и ничем не ограниченное обсуждение внут- 
реннего устройства языка на всех уровнях абстракции -— от типов данных, пе- 
ременных и регулярных выражений до подпрограмм, модулей и объектов. 
Читатель получит хорошее представление о том, как работает язык, а также 
несколько советов по правильному проектированию программ. (А тех, кто ни- 
когда не использовал язык с поиском по шаблону, ждет особое удовольствие.) 


Часть Ш «Рей как технология» 


Многое можно делать с помощью одного только Ре! но в этой части вы изучи- 
те волшебство более высокого уровня. Узнаете о том, как заставить Рег! прой- 
ти через все препятствия, которые поставит перед ним ваш компьютер, — от 
обработки Юникода, взаимодействия процессов и многопоточности до компи- 
лирования, вызова, отладки и профилирования, а также создания собствен- 
ных внешних расширений на С или С++ или интерфейсов к имеющимся АРІ. 
Реп будет счастлив побеседовать с любым интерфейсом на вашем компьютере, 
да, пожалуй, и любом другом компьютере в Интернете. если позволят погод- 
ные условия. 


Псевдохеши – виртуальные ассоциативные массивы. — Прим. ред. 


2 Воспользуйтесь командой рей 4ос рей ав или адресом ВИр://рейдос.рет.ога/рейа- 
ав ти. – Прим. ред. 
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Часть ТУ «Рей как культура» 


Каждому ясно, что у культуры должен быть свой язык, но сообществу Ре! все- 
гда было ясно, что у языка должна быть культура. В этой части мы рассматри- 
ваем программирование на Рег! как человеческую деятельность, являющуюся 
частью реального мира людей. Мы также даем много советов относительно то- 
го, как заниматься самосовершенствованием и как сделать, чтобы ваши про- 
граммы приносили больше пользы людям. 


Часть У «Справочный материал» 


Здесь собраны главы, в которых читатель сможет найти что-либо в алфавит- 
ном порядке — от специальных переменных и функций до стандартных моду- 
лей и прагм. Глоссарий будет особенно полезен тем, кто не знаком с жаргоном 
вычислительной техники. Например, те, кто не знает, что такое «прагма», мо- 
гут прямо сейчас посмотреть значение этого слова. (А тем, кто не знает значе- 
ние слова «такое», мы не можем помочь ничем.) 


Стандартный дистрибутив 


Официальная политика Ре!|, как отмечается в странице рейройсу справочного 
руководства!, заключается в поддержке двух последних официальных версий. 
Поскольку на момент написания этих строк текущей была версия у5.14. это озна- 
чает, что официально поддерживаются обе версии, у5.12 и у5.14. Когда будет вы- 
пущена версия у5.16, официальная поддержка версии у5.12 прекратится. 


Внастоящее время большинство производителей операционных систем включают. 
Реп в качестве стандартной составляющей своей системы, хотя их цикл выпуска 

новых версий может не совпадать с циклом выпуска новых версий Рег]. На момен“ 

написания данной книги Ре! входит в стандартные дистрибутивы АХ, Ве05, 

ВОТ, РеШап, ОС/ОХ, БУМЕХ/рёх, ЕгееВ5О, ІКІХ, ГупхОБ, Мас ОЗ Х, ОрепВ5О, 

08390, Кейна, ЭП\ЩХ, Ѕ1аскуаге, Зо]ат1з, Зи Е и Тгиб4. Некоторые компании по- 

ставляют Ре! на отдельных СО с бесплатным программным обеспечением или че- 

рез группы обслуживания клиентов. Сторонние производители, такие как Асіїуе- 

Ѕќаѓе, предоставляют откомпилированные дистрибутивы для ряда операционных 

систем, в том числе производимых Місгоѕоѓі. 


Даже если производитель включил Регі в стандартный дистрибутив, в конечном 
итоге, возможно, понадобится откомпилировать и установить Рег! самостоятель- 
но. В результате вы будете знать, что ваша версия является самой свежей, и смо- 
жете сами выбрать, куда установить библиотеки и документацию. Также можно 
будет решить, следует ли скомпилировать Ре! с поддержкой дополнительных 
расширений, таких как поддержка многопоточной модели выполнения, большие 
файлы или множество низкоуровневых опций отладки, доступ к которым осуще- 
ствляется через ключ командной строки -Р. (Отладчик уровня пользователя под- 
держивается всегда.) 


Проще всего загрузить комплект исходного кода Ре], указав браузеру домаш- 
нюю страницу на илуь.рей.ога, где на видном месте располагается информация 
о загружаемых файлах, а также доступны ссылки на компилированные двоич- 
ные модули для платформ, компиляторы С для которых затерялись. 


1 Команда ре 4ос ретройсу или һћ2ір:/[регійос.регі.огє/регіроіісу.ћіті. — Прим. ред. 
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Можно также направиться прямо в архив СРАМ, описанный в главе 19, по адресу 
Вир://шило.срап.огг. Если работа с ним окажется слишком медленной (а это может 
случиться, поскольку он очень популярен), следует найти зеркальный сервер 
СРАМ поблизости от себя. На странице #Нр://шши.срап.ота/ЗГТЕ т приводит- 
ся список всех сайтов архива СРАМ, откуда вы можете выбрать удобное для вас 
зеркало. Некоторые зеркала доступны по ЕТР, другие по НТТР (что может иметь 
значение для тех, кто выходит в Интернет из корпоративной сети, защищенной 
брандмауэром). Мультиплексор #Нр://шши.срап.огЕ попытается принять решение 
автоматически. однако при желании вы легко сможете изменить этот выбор. 


Получив исходный код и распаковав его в каталог, следует прочесть файлы 
ВЕАГМЕ и ГУЗТА,, чтобы узнать, как выполнить сборку Рен. В каталоге мо- 
жет также иметься файл ІМЅТАІІ.ріаіјогт, где ріаіјогт представляет платфор- 
му вашей операционной системы. 

Если данная платформа является разновидностью ОМІХ, то команды, необходи- 
мые для получения, конфигурирования, сборки и установки Ре, могут быть 
примерно следующие. Во-первых, необходимо выбрать команду, с помощью кото- 
рой будет получен исходный код. Загрузить пакет можно с помощью браузера. 
или инструмента командной строки: 


х мдеї НЕЁЕр: //мим. срап. ого/5гс/5.О/таіпі. таг. 02 


Теперь нужно распаковать, сконфигурировать, собрать и установить: 


Х таг 2х 1атеѕі. таг. 02 # или сначала дип2ір, а затем Таг х. 
Х са рег1-5. 14.2 # или 5.* для других версий 
Х 5! СопЁ1диге -деѕ # принимает ответы по умолчанию. 


Х паке тез && таке 1п3фа11 # обычно требует привилегий суперпользователя 


Для вашей платформы могут иметься уже готовые пакеты, не требующие выпол- 
нения всех этих операций (а также включающие исправления и расширения для 
вашей платформы). Кроме того, многие платформы уже включают предустанов- 
ленный Регі, так что описанные действия могут оказаться ненужными. 


Если Рей уже установлен, но вам хочется установить другую версию, можно из- 
бежать лишней работы, воспользовавшись инструментом рейбгеи.. Он автомати- 
зирует все описанные действия и выполняет установку в каталог, куда вы имеете 
право устанавливать файлы, если не обладаете привилегиями администратора. 
Этот инструмент доступен в СРАМ под названием Арр: :рег10бгем, но вы можете уста- 
новить его, выполнив следующие действия, как описывается в документации: 


Х сиг1 -Ё Втр: //хг1. из/рег16геи1п$1а11 | Базв 


После установки просто позвольте этому инструменту выполнить всю работу за 
вас: 


Х -/рег15/рег16гем/61п/рег16гем іпѕ+а11 рег1-5. 14. 2 


Однако этим возможности инструмента регліргеш не ограничиваются, поэтому за 
дополнительной информацией обращайтесь к документации. 


Существуют также расширенные версии стандартного дистрибутива Рей. Ком- 
пания Асііуе$іабе предлагает АсііуеРегі (ліѓр://илгш.асіірезіа?е.сот/асіїуерегі/ 
аошщоаа3) – бесплатные версии для Уіпаоуѕ, Мас ОБ Х и Шпих и платные – для 
ЅоЈагіѕ, НР-ОХ и АІХ. 
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ЗёгамЪеггу Рей (ћ?ёр://зігашђеггурегі.оге[) – версия для УУЛпдо\з, включающая 
различные инструменты. необходимые для компиляции и установки сторонних 
модулей Ре! из СРАМ. 


СИгиз Рей (ћёёр://илош.сіёғиѕрегі.сот/) — дистрибутив для УЙЯпао\з, Мас ОБ Х 
и Шпих, включающий инструментарий ухРегі для создания графических интер- 
фейсов. Он предназначен для тех, кто желает создавать на языке Рей программы 
с графическим интерфейсом. А в распространении этих приложений вам помо- 
жет другой инструмент, Сауа Раскарег (ћіір://илло.саоа.соиЕ/), также входящий 
в состав этого дистрибутива. 


Электронная документация 


Обширная электронная документация по Ре] входит в состав его стандартного 
дистрибутива. (О печатной документации говорится в следующем разделе.) До- 
полнительная документация появляется, как только устанавливается новый мо- 
дуль из СРАМ. 


Упоминая в этой книге «страницы руководства Регі», мы имеем в виду комплект 
электронных страниц руководства по Ре! |, который находится на вашем компью- 
тере. Под страницей электронного руководства (таправе) будем понимать про- 
сто файл с документацией, для чтения которого необязательно иметь ОМХ:-про- 
грамму тап. Страницы руководства Рег] могут быть установлены даже как стра- 
ницы НТМГ, особенно в системах, отличных от ОМІХ. 


Электронные страницы руководства по Ре! разделены на несколько секций, по- 
этому можно легко найти нужное, не продираясь через сотни страниц текста. По- 
скольку страница верхнего уровня называется просто рей, то в ОМІХ команда пап 
регі должна привести именно на нее.! Эта страница, в свою очередь, обозначает 
страницы, посвященные конкретным темам. Например, пап рег1ге выведет стра- 
ницу руководства по регулярным выражениям Ре!1. Команда рег190с часто рабо- 
тает в тех системах, в которых не работает команда пап. В вашем дистрибутиве 
могут также содержаться страницы руководства по Рей в формате НТМГ или 
родном для системы формате подсказки. Уточните этот вопрос у своего системно- 
го администратора - если, конечно, сами не являетесь им. 


Навигация по стандартным страницам руководства 


В незапамятные времена (если говорить о Рег], то имеется в виду 1987 год) страни- 
ца руководства ре] была кратким документом объемом около 24 печатных стра- 
ниц. Например, раздел по регулярным выражениям занимал всего два абзаца. 
(Этого было достаточно при условии знакомства с едгер.) В некоторых отношениях 
с тех пор изменилось почти все. Если считать стандартную документацию, различ- 
ные утилиты, сведения о переносах на различные платформы и множество стан- 
дартных модулей, то наберется несколько тысяч печатных страниц документа- 
ции, разбросанных по многим отдельным страницам электронного руководства. 


1 Если при этом открывается нечто необозримое, то, вероятно, вы обращаетесь к древне- 
му руководству версии 4. Проверьте, не указывает ли переменная среды МАМАРАТН на мес- 
та, где можно производить археологические раскопки. (Введите рег10ос рег1, чтобы уз- 
нать, как настроить МАМРАТН соответственно выдаче команды рег! -\:пап.91г.) 
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(И это без учета модулей из СРАМ, которые могут быть у вас установлены, и в не- 
малом количестве.) 


Но в других отношениях не изменилось ничего: по-прежнему жива страница ру- 
ководства регі и по-прежнему она является наилучшей отправной точкой, когда 
вы не знаете, откуда начать. Разница в том, что, попав туда, нельзя остановиться. 
Документация — это больше не кустарное производство, это торговый пассаж 
с сотнями магазинов. Войдя в дверь, необходимо найти плакат, который поможет 
определить, где находится лавка или универсальный магазин, продающий то, 
зачем вы пришли. Конечно, освоившись в торговом центре, как правило, заранее 
знаешь, куда направиться. 


Вот некоторые вывески: 
Таблица 1. Некоторые страницы руководства по Рей 


Страница руководства | Что освещает 


регі Доступные страницы руководства по Рег] 
регійаіа Типы данных 

регіѕуп Синтаксис 

регіор Операторы и их приоритеты 

регіғе Регулярные выражения 

регірағ Предопределенные переменные 

регіѕир Подпрограммы 

регіјипс Встроенные функции 

рейтоа Как использовать модули Рег 

рейге! Ссылки 

регіоБј Объекты 

регіірс Взаимодействие между процессами 
рейгип Как выполнять команды Рег], = также ключи 
регійеђБив Отладка 

регійав Диагностические сообщения 


Это лишь небольшой отрывок, но в нем содержится самое необходимое. Как вид- 
но, если нужны сведения о том или ином операторе, вам потребуется ретор. А ес- 
ли нужно что-то выяснить о предопределенных переменных, следует искать 
в рейоаг. Если получено непонятное диагностическое сообщение, обращайтесь 
к рей даа. И так далее. 


В стандартное руководство по Рей входит список часто задаваемых вопросов 
(ЕАО). Он разбит на девять разных страниц, перечисленных в табл. 2: 


Таблица 2. Страницы из списка часто задаваемых вопросов 


Страница руководства |Что освещает 


регіјад1 Общие вопросы о Рег] 
регіјадё2 


регіїадЗ 


Получение Ре! и сведения о нем 


Инструменты программирования 
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Таблица 2 (продолжение) 


Страница руководства | Что освещает 


регаа4 Обработка данных 

регіјад5 Файлы и форматы 

регіјадб Регулярные выражения 
регіїад7 Общие особенности языка Рей] 
ре ач8 Взаимодействие с системой 


регіад9 Сетевое взаимодействие 


Некоторые страницы руководства (табл. 8) содержат замечания по специфике 
платформ: 


Таблица 3. Страницы с замечаниями по специфике платформ 


Страница руководства | Что освещает 


регіатіва Версия для Апиа 
ретйсувилт Версия для Суржіп 

регійоѕ Версия для М5-роОв 
рєгіћрих Версия для НР-ОХ 
рейтасмеп Версия для Ромег МасћТеп 
регіоѕ2 Версия для 05/2 

регіоѕ390 Версия для 08/890 
рейотз Версия для РЕС УМ 
регішіп32 Версия для М5-№іпдомѕ 


Относительно версий для разных платформ см. также главу 22 и каталог рогіѕ 
в архиве СРАМ (лёёр://илош.срап.ога/рогіѕ/іпіех.ћіт!), описанном выше. 


Страницы руководства, не принадлежащие Регі 


Когда мы ссылаемся на документацию, не принадлежащую Реп, как в случае ден: 
нтег(2), ссылка указывает на страницу дейНтег из раздела 2 руководства Ошх 
Рговтаттег”з Мапиа].1 Страницы руководства для системных вызовов, вроде 
денитег, могут отсутствовать в системах, отличных от ОМІХ, но ведь системные 
вызовы ОМХ в таких операционных системах все равно использовать не получит- 
ся. Для тех, кому действительно требуется документация по команде, системному 
вызову или библиотечной функции ОМІХ, скажем, что многие организации по- 
местили свои страницы руководства в Интернете. Выполнив поиск по строке 
сгурї(3) в @оое, можно найти множество копий данной конкретной страницы. 


1 В разделе 2 должны содержаться только сведения о прямых вызовах операционной 
системы. (Они часто называются системными обращениями («зузфет са]їѕ»), но мы не- 
уклонно называем их в этой книге системными вызовами (зузсаПз), чтобы не спутать 
с функцией зуз{ет, не имеющей отношения к системным вызовам. Однако между сис- 
темами есть некоторые различия в том, какие вызовы реализованы как системные, 
а какие – как обращения к библиотекам С, поэтому есть вероятность, что де {1тег(2) 
обнаружится в разделе 8. 
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Хотя страницы руководства по Рег верхнего уровня обычно устанавливаются 
в разделе 1 стандартных каталогов тап, мы не будем добавлять (1) к названиям 
таких страниц руководства в нашей книге. Их легко узнать, поскольку они име- 
ют вид «рег1бубубу». 


Печатная документация 


Тем, кто хочет больше узнать о Ре, рекомендуем некоторые издания: 


«Рег 5 Роскеё Ве{егепсе», Бу Јоһап Уготапз; О’ВеШу Мебла (5 Едійоп, лу 
2011). Эта маленькая брошюра служит удобным справочником по Рег]. 


«Рег СоокЬооК», Бу Тот Сһгіѕйапѕеп апа Мафап Тогкіпьёоп, О’ВеШу Медіа 
(2па Едібоп, Ацеоѕі 2003). Эта книга дополняет ту, которая сейчас у вас в ру- 
ках. Она содержит готовые рецепты программирования на Рег]. 


«Геагпшя Рей», Бу Вапда! Ѕсһмагі2, бгіар а ѓоу, апа Тот Рһоепіх; О’ВеШу 
Меаіа (6 Еаііоп, Јипе 2011).? Эта книга учит программистов тем 30% основ 
Рей, которые пригождаются в 70% случаев. Она ориентирована на тех, кто 
пишет автономные программы, содержащие порядка пары сотен строк. 


«Іпіегтедіаѓе Рег1», Бу Вапда! Зсһуагіт, іар д ѓоу, апа Тот Рһоепіх; О’ВеШу 
Медіа (Аосиѕі 2012). Эта книга является продолжением книги «Геагпіпе 
Рей» («Изучаем Регі») и знакомит читателей со ссылками, структурами дан- 
ных, пакетами, объектами и модулями. 


«Маѕёегіпе Ре», Бу бгіар а оу; О’ВеШу Медіа (Јиу 2007). Это последняя кни- 
га трилогии, включающей также книги «еагпіпє Рей» («Изучаем Рег») 
и «Іпіегтедіаќе Рей» («Изучаем Ре! глубже»). Вместо основ языка она рас- 
сматривает вопросы применения Ре! для решения повседневных задач. 


«Мойегп Регі», бу сһготаќіс; Оупх №веоп (ОсфоБег 2010). Эта книга содержит об- 
зор современных тем и приемов программирования на Рег] для тех, кто уже 
занимается программированием, но не уделяет внимания последним событи- 
ям в мире Регі. 


«Мазбегшя Верщаг Ехргеѕѕіопѕ», Бу ЗеЁгеу Егіеа!; О’ВеШу Медіа (Зга Еаіііоп, 
Аир 2006).1 Хотя в книге не освещены последние нововведения в регуляр- 
ных выражениях Реп, она является ценным справочником для всех. кто хо- 
чет знать, как работают регулярные выражения. 


«ОБесф Омещеа Рец», Бу Оатіап Сопуау, Маппіпе, 1999. Для начинающих 
и опытных разработчиков объектно-ориентированных программ. Эта книга из- 
лагает обычные и тайные приемы создания мощных объектных систем на Рет]. 


Т. Кристиансен, Н. Торкингтон «Ре|: библиотека программиста». — Пер. сангл. – СПб.: 
Питер, 2001. 


Р. Шварц, брайан д фой и Т. Феникс «Изучаем Ре, 5-е издание. – Пер. с англ. — СПб.: 
Символ-Плюс, 2009. 


Р. Шварц, брайан д фой и Т. Феникс «Рег: изучаем глубже», 3-е издание. – Пер. сангл. - 
СПб.: Символ-Плюс, 2014. 


Д. Фридл «Регулярные выражения», 3-е издание. — Пер. с англ. — СПб.: Символ-Плюс, 
2008. 
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е «Мафегше А1согіїһтѕ мВ Рец», Бу Јоп Огуапф, ЈагкКко Нефашепи, апа Доп 
Масдопа@, О’ВеЩу, 1999. Все полезные приемы из курса вычислительных ал- 
горитмов. но без тягостных доказательств. Книга освещает фундаментальные 
и полезные алгоритмы, относящиеся к графам, текстам, множествам и ряду 
других областей. 


Существует много других книг и публикаций по Рег], и по старческой дряхлости 
мы наверняка позабыли упомянуть некоторые хорошие. (Из милосердия мы не 
стали отмечать некоторые плохие издания.) 

Помимо перечисленных публикаций, относящихся к Рей, мы рекомендуем сле- 

дующие книги. Они не посвящены непосредственно Ре, но их бывает удобно 

иметь под рукой в качестве справочника, источника советов или вдохновения. 

• «Тһе Ат оѓ Сотриќег Ргозтати те», Бу опа Кпиёћ, Уоштез 1-4А: «Гипда- 
тепіа] А]еєогійпѕ», «Зешіпишпегіса! А1согіїһтѕ», «Эогііпе апа беаісћіпе», 
апа «СотЫпаюг1а1 А]єогіһтѕ»; АадіѕопМеѕ1еу (2011)! 

• «1 ігодӢцсііор {о АІеогйлѕ», Бу Тћотаѕ Согтеп, Сћагіеѕ Геіѕегѕоп. апа КопаЈа 
Кіуеѕі; МІТ Ргеѕѕ апа МсСгам-НИ (1990). 


• «АІсогійтѕ іп С», Бу КоБег& Ѕейсеміск, Аадіѕоп-Меѕ1еу (1990). 


• «Тһе Е1етепіз оғ Ргоргаттіпе ЅёуІе», Бу Вмап Кегпісћап апа Р.Ј. Раибег; 
Ргепіісе-На1! (1988). 


• «Тһе 0піх Ргобтаттпіпе Епуігоптепі», бу Вгіап Кеги1еВап апа КоБ Р\е; Ргеп- 
Нсе-На| (1984)? (Зга Еаібйоп, Ацсиві 2006). 


• «РОБЕХ Рговгаттег"ѕ Слиде», Бу опа! Геміпе, О’КеШу Медіа (1991). 

• «Адуапсеа Ргоргаттіпе іп іће ОМІХ Епуігоптепі», Бу У. Кісһага Зќеуеп» апа 
Ѕёерһеп А. Басо, Адаіѕоп-Ұеѕ1еу (3га Едійоп, Мау 2013).3 

• «ТСР/ІР Шазгаед», усов. 1-3, Бу №. Бісһага Ѕіеуеп, АЯа1зоп-УТееу (1992— 
1996). 

• «ТЬе Гога оғ Һе Біраѕ», Бу Ј. В. В. ТоЦ1еп, Ноцећоп Міёр (0.5.) апа Нагрег 
СоШпз (О.К.) (последнее издание: 2005).* 


Дополнительные источники 


Интернет — чудесное изобретение, и все мы продолжаем открывать возможности 
его наиболее полного использования. (Конечно, некоторые предпочитают «от- 
крывать» Интернет так, как Толкин открывал Средиземье.) 


Д.Кнут «Искусство программирования», тома 1-4А: «Основные алгоритмы», «Полу- 

численные алгоритмы», «Сортировка и поиск», «Комбинаторные алгоритмы, часть 1». — 

Пер. с англ. – Вильямс, 2018. 

2 Брайан Керниган и Роб Пайк «ОХІХ. Программное окружение». – Пер. с англ. — СПб.: 
Символ-Плюс, 2008. 

з У. Ричард Стивенс и Стивен Раго «ОМТХ. Профессиональное программирование», 8-е 

издание. — Пер. сангл. – СПб.: Символ-Плюс, 2014. 


“ Дж.Р.Р. Толкин «Властелин Колец», АСТ, 2009. 
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Реп в Сети 


Посетите домашнюю страницу Ре ВНр://шши рей.ог8/. Она предлагает новости 
мира Рен, исходные коды и скомпилированные версии для разных платформ, те- 
матические статьи, документацию, расписания конференций и многое другое. 


Посетите также веб-страницу Рег Мопеегз ћіір://шило.рт.огв, чтобы взглянуть 
на Реті с точки зрения широких масс, так сказать, на «корни», которые бурно раз 
растаются во всех частях света, за исключением Южного полюса, где их прихо- 
дится держать в закрытом помещении. Местные группы РМ проводят регуляр- 
ные небольшие встречи, на которых можно обменяться профессиональным опы- 
том с другими хакерами Регі, живущими в той же части света. 


Сообщения об ошибках 


В том маловероятном случае, если ошибка обнаружена в самом Ре! а не в вашей 
программе, нужно постараться воспроизвести ее в минимальном по объему конт- 
рольном примере и сообщить о ней с помощью программы ре Фиа, поставляемой 
с Регі. Дополнительные сведения можно найти на йНр://Бияз.ре[.ога. 


В действительности, команда регіБиє является лишь интерфейсом к инструменту 
учета дефектов под названием ВТ.! Кроме того, отчет об ошибке можно отправить 
на адрес рейьи@рет.оги без привлечения дополнительных инструментов, одна- 
ко рейфиЕ вместе с отчетом отправляет дополнительную информацию о вашей 
версии Регі, такую как номер версии и флаги компиляции, которые могут помочь 
разработчикам определить источник вашей проблемы. 


Можно также заглянуть в список существующих дефектов. Возможно, кто-то 
уже столкнулся с вашей проблемой. Начните со страницы ћіїрз://гё.регі.оге/ и пе- 
рейдите по ссылке регі5. 


Если речь идет о стороннем модуле из архива СРАМ, следует воспользоваться дру- 
гой версией инструмента КТ по адресу: АИрз://"Е.срап.огв/. Однако следует учи- 
тывать, что не все модули в архиве СРАМ“ пользуются бесплатной услугой КТ, по- 
этому всегда проверяйте документацию, где могут приводиться дополнительные 
инструкции, касающиеся отправки отчетов об ошибках. 


Соглашения, принятые в этой книге 


Некоторые из принятых нами соглашений более подробно обсуждаются в соот- 
ветствующих разделах. Соглашения по коду обсуждаются в разделе «Стиль про- 
граммирования» главы 21. Можно сказать, что наши лексические соглашения 
представлены в глоссарии (наш словарь). 


Вкниге приняты следующие типографские соглашения: 
ЗАГЛАВНЫЕ СИМВОЛЫ 


Используются для обозначения формальных названий символов Юникода 
и логических операторов. 


1 Проект Веѕі Ргасйса], в рамках которого осуществляется разработка инструмента Ве- 
асоеѕі ТгасКег, или ВТ, бесплатно предоставляет свою платформу основным проектам 
Реп, включая сам рей и все пакеты в архиве СРАМ. 
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Курсив 


Применяется для ОВТГ-адресов, страниц руководства, имен файлов и про- 
грамм. Новые термины тоже выделяются курсивом при первом появлении 
в тексте. Для многих из этих терминов можно найти альтернативные опреде- 
ления в глоссарии, если недостаточно тех, которые имеются в тексте. Курсив 
также используется для выделения команд и ключей командной строки. Это, 
к примеру, позволяет отличить ключ -и, включающий вывод предупрежде- 
ний, от параметра -м (проверки наличия файла). 


Моноширинный 


Используется в примерах и в обычном тексте для выделения программного 
кода. Данные обозначаются моноширинным шрифтом м заключаются в кавычки 
(""), не являющиеся частью значения. 


Моноширинный курсив 


Служит для обозначения общих элементов кода, вместо которых необходимо 
подставить конкретные значения. Он также используется в некоторых приме- 
рах, чтобы выделить вывод, производимый программой. 


Моноширинный полужирный 


Этот шрифт используется в примерах для обозначения текста, который вво- 
дится в командной строке. 


Моноширинный полужирный курсив 


Используется для выделения вывода программы, когда требуется отличать 
его от текста, вводимого в командной строке. 


Мы приводим множество примеров, и в большинстве случаев это фрагменты бо: 
лее крупных программ. Некоторые примеры являются завершенными програм: 
мами, что можно увидеть по начальной строке #!. Почти все наши более длинные 
программы начинаются со строки: 


#1 /изг/61п/рег1 


В других примерах приводится текст, который следует ввести в командной стро- 
ке. Мы используем % для обозначения приглашения оболочки: 


Х рег1 -е ‘ргіпё "Не110, мог1а. \п”' 
Не110, мог1а. 


Этот стиль – типичный образец стандартной командной строки ОМІХ, в которой 
одиночные кавычки представляют «наиболее закавыченный» формат. В других 
системах соглашения по использованию кавычек и шаблонных символов могут 
быть иными. Например, многие интерпретаторы команд в М5-РОБ и УМ$ требу- 
ют двойные, а не одиночные кавычки при определении аргументов, содержащих 
пробелы и шаблонные символы. 


Благодарности 


Здесь мы публично приносим благодарность нашим советникам, консультантам 
и рецензентам, что должно компенсировать все грубости, сказанные им в частном 
порядке. Это: Эбигайл (Авај), Мэтью Барнетт (Ма Ъе\у Вагпей), Пирс Коули 
(Ріегѕ Са\еу), сБтотайс (хроматик), Дамиан Конвей (Оатіап Сопугау), Дейв Кросс 
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{Пауе Сгоз5), Хоакин Ферреро (Јоадиіп Ееггего), Джеремиа Фостер (Јегетіаһ Роз- 
ќег), Джефф Хеймер (Те! Наетет), Юрий Маленький (Үпгіу МаІепкіу), Нуно Мен- 
дес (Мипо Мепаеѕ), Стеффен Мюллер (Хе еп Мег), Энрике Нелл (Ёпгідие Ме), 
Дэвид Никол (Юауій №ісо!), Флориан Рагвитц (ЕІогіап Каруійг), Эллисон Рэндал 
(Аіѕоп Вапда!), Крис Роедер (Сһгіѕ Коедег), Кит Томпсон (Кей Тһотрѕоп), ЛеоЕ 
Тиммерманс (Геоп Типтегтапѕ), Натан Торкингтон (ъаіһап Тогкіпрёоп), Йохан 
Вроманс (Јоһап Уготапз) и Карл Уильямсон (Ка! МУ! Шіатвоп). 


Особую благодарность хотим выразить всем сотрудникам издательства О’КеШу 
Медіа за их героические усилия в преодолении бесчисленных, неожиданных 
и необычных проблем, связанных с опубликованием этой книги в современном 
постмодернистском издательском мире. В первую очередь мы хотели бы сказать 
спасибо нашему выпускающему редактору Холли Бауэр (НоПу Ваџег) за ее беско- 
нечное терпение в отношении тысяч маленьких уточнений и изменений, сделан- 
ных уже после сдачи рукописи. Мы благодарны начальнику производственного 
отдела Дэну Фоксмиту (ап Еаихѕтіїћ) за его упорство в поиске редких шрифтов, 
необходимых для многочисленных примеров использования Юникода, и за под- 
держание плавности хода производственного конвейера. Мы признательны заве- 
дующему производством Адаму Уитверу (Айат Мймег) за то, что он, засучив ру- 
кава, самоотверженно боролся с программным комплексом Атщеппа Ноцзе, при- 
менявшимся для создания готовой к тиражированию копии книги. Наконец, 
благодарим издателя Лори Петрицки (Гале Реёгускі): она не просто поддержала 
всех причастных к созданию книги, о которой мечтали авторы, но и воодушевила 
самих авторов на создание книг, прочтение которых приносит людям массу удо- 
вольствия. 


Ѕаѓагі° Воок$ Опііпе 


„> Ѕаѓагі Воокѕ Опііпе – это виртуальная библиотека, которая по- 
ба Ға ГІ зволяет легко и быстро находить ответы на вопросы среди более 
вогиотта чем 7500 технических и справочных изданий и видеороликов. 


Подписавшись на услугу, вы сможете загружать любые страницы из книги про- 
сматривать любые видеоролики из нашей библиотеки. Читате книги на своих мо- 
бильных устройствах и сотовых телефонах. Получать доступ к новинкам еще до 
того, как они выйдут из печати. Читать рукописи, находящиеся в работе, и посы- 
лать свои отзывы авторам. Копировать и вставлять отрывки программного кода, 
работать с закладками, загружать отдельные главы, помечать ключевые разде- 
лы, оставлять примечания, печатать страницы и пользоваться массой других 
преимуществ, позволяющих экономить ваше время. 


Благодаря усилиям О’ВеШу Медіа данная книга также доступна через службу 
Ѕағагі Воокѕ Опіпе. Чтобы получить полный доступ к электронной версии этой 
книги, а также к другим книгам схожей тематики, изданным О’ВеШу и другими 
издательствами, подпишитесь бесплатно по адресу ћіір://ту.ѕајагіроокѕопііпе.сот. 


Хотим услышать ваши отзывы 


Мы протестировали и выверили все сведения, представленные в этой книге так 
тщательно, как могли, но читатели могут обнаружить, что некоторые функции 
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претерпели изменения (или даже что мы допустили ошибки!). Просим сообщать 
обо всех найденных ошибках, а также пожеланиях для последующих изданий по 
адресу: 

О’ВеШу & Азвочафев, Іпс. 

1005 Огауепзѓеіп Н1ой\ау Мог 

1-800-998-9938 (в США и Канаде) 

1-707-829-0515 (международный/местный) 

1-707-829-0104 (факс) 
Книга имеет свой веб-сайт, где можно найти список обнаруженных ошибок и дру- 
гую информацию: 

Һг1р://ѕћор.огеШу.сот/ргойисі/9780596004927.10 


Здесь же вы найдете все примеры программного кода, доступные для загрузки, 
что избавит вас от необходимости набирать их вручную, как это делали мы. 


Свои комментарии и вопросы технического характера, касающиеся этой книги, 
направляйте по адресу: 


фоордиезноп@огеШу.сот. 


Дополнительную информацию о книгах, конференциях, центрах ресурсов и сети 
издательства О’ВеШу вы найдете на сайте: 


Һр://илло.огеШу.сот 
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Общий обзор 


Обзор Реп 


Введение 


Мы считаем Рей языком, который легко освоить и применять, и надеемся убе- 
дить в этом и вас. Одна из особенностей Рег|, делающих его легким языком, за- 
ключена в возможности без обиняков сказать то, что необходимо сказать. Во мно- 
гих языках программирования приходится объявлять типы, переменные и под- 
программы, которые предполагается использовать, прежде чем написать хотя бы 
одну строчку выполняемого кода. Подобные объявления — разумный подход, ес- 
ли речь идет о сложных задачах, требующих сложных структур данных. Но для 
многих более простых, повседневных задач хотелось бы иметь язык программи- 
рования, на котором можно просто сказать: 


ргіпі “Номау, мог1а!\п”; 


и программа это сделает. 


Таким языком и является Рец. На практике этот пример представляет собой за- 
конченную программу", и если передать ее интерпретатору Регі, тот выведет на эк- 
ран "Ному, мог1а!". (\п в этом примере обеспечивает перевод строки в конце вывода.) 


Вот и все. После того как вы сказали, что хотели, тоже не требуется произносить 
много слов. В отличие от многих языков программирования, Рег! считает, что «вы- 
валиться» из программы, когда закончился исходный текст, — нормальный способ 
ее завершения. Конечно, при желании вы можете явно вызвать функцию ехії, как 
можете и объявить некоторые переменные, либо даже сделать обязательным объ- 
явление всех переменных. Но право выбора принадлежит вам. В Рег можно по- 
ступать «так. как должно» согласно вашему личному пониманию этих слов. 


Есть много других причин, по которым Регі легко использовать, но перечислять 
сейчас их все бессмысленно, поскольку этому и посвящена наша книга. Говорят, 


1 Или «сценарий» (ѕсгірі), «приложение» (аррПса@ оп), «исполняемый объект» (ехесџіађ- 


1е), «штуковина» (йооћісКкеу). Кому что больше нравится. 
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что дьявол проявляет себя в частностях, но Ре! старается облегчить вашу жизнь 
и в трудных ситуациях. На любом уровне Рег! заботится о том, чтобы доставить 
вас туда, куда нужно, с минимумом суеты и максимумом комфорта. Вот почему 
многие программисты на Рег] ходят с глупыми ухмылками на физиономиях. 


Эта глава представляет собой обзор, поэтому мы не пытаемся представить Регі 
с рациональной стороны. Равно как не претендуем на полноту изложения или ло- 
гичность. Для этого предназначены следующие главы. Вулканцам, андроидам 
и другим лицам аналогичного склада ума следует пропустить этот обзор и перейти 
сразу к главе 2, где плотность информации выше. С другой стороны, тем, кому ну- 
жен учебник, где все постепенно раскладывается по полочкам, возможно, следует 
обратиться к книге «Т.еагите Рег1»!. Но и данную книгу пока не выбрасывайте. 


Эта глава представляет Рег] другому полушарию вашего мозга, тому, которое назы- 
вают ассоциативным, артистическим, управляющим эмоциями или просто впи- 
тывающим. Для этого Регі рассматривается с разных точек зрения, чтобы дать чи- 
тателю о нем такое же ясное представление, какое слепцы могли получить о слоне 
(ощупывая его). Возможно, мы продвинемся дальше мудрецов: мы все-таки имеем 
дело с верблюдом (см. обложку). Надеемся, что хотя бы одно из этих представлений 
о Рег! поможет вам меньше горбатиться. 


Естественные и искусственные языки 


Языки были изобретены людьми и для блага людей. В анналах компьютерных 
наук этот факт случайно оказался позабытым.? Поскольку (допуская вольность 
речи) можно сказать, что создателем Регі является лингвист, этот язык, по за 
думке, должен работать так же гладко, как естественные языки. Само собой, это 
охватывает множество аспектов, поскольку естественные языки хорошо работа: 
ют одновременно на нескольких уровнях. Можно было бы перечислить многие из 
этих лингвистических принципов, но самым важным принципом проектирова- 
ния языка является тот, что простые вещи должны делаться просто, а сложные 
вещи должны быть реализуемы. (На самом деле, здесь два принципа.) Они могут 
показаться вам очевидными, однако многие языки программирования не удовле- 
творяют то одному, то другому условию. 


Естественные языки удовлетворяют обоим условиям, поскольку люди непрерыв- 
но пытаются выражать как простые, так и сложные мысли, и поэтому языки раз- 
виваются так, чтобы справляться с обеими задачами. Рег| проектировался, пре- 
жде всего, как язык развивающийся, и он действительно эволюционировал со 
времени своего создания. Вклад в эволюцию Рег! вносили многие люди на протя- 
жении ряда лет. Мы часто шутим, что верблюд - это лошадь, спроектированная 
комитетом, но если вдуматься, верблюд достаточно хорошо приспособлен для 
жизни в пустыне. Эволюция привела верблюда к относительной самодостаточно- 
сти. (С другой стороны, в результате эволюции верблюд не стал лучше пахнуть. 
Как и Рен.) Вот одна из многих странных причин, почему мы сделали верблюда 
талисманом Ре, но к лингвистике это имеет отдаленное отношение. 


' Рэндал Шварц, Том Феникс, брайан д фой «Изучаем Ре», 5-е издание. – Пер. с англ. — 
СПб.: Символ-Плюс, 2009. 


2 Точнее, об этом факте вспоминают от случая к случаю. 
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Далее. Когда кто-то произносит слово «лингвистика», многие начинают думать 
о словах либо о предложениях. Но слова и предложения — это лишь пара удобных 
способов членения речи. Те и другие можно разбить на более мелкие смысловые 
единицы или объединить в более крупные. А смысл каждой единицы существен- 
но зависит от синтаксического, семантического и практического контекста, в ко- 
тором находится эта единица. В естественном языке есть слова разных видов: су- 
ществительные, глаголы и прочее. Если произнести слово «дор» (собака) изоли- 
рованно, в отрыве от контекста, представляется существительное, хотя можно 
использовать это слово и в других смыслах. То есть существительное может вы- 
полнять функции глагола, прилагательного или наречия в зависимости от кон- 
текста. «Г уоџ доғ а дос аџгіпе ће Пов Чауз оё затитег, уои бе а йор бігеа дорсаі- 
сһег.»! Ре] также по-разному интерпретирует слова в зависимости от контекста. 
Далее мы увидим, как он это делает. Помните просто, что Рег! пытается понять, 
о чем идет речь, как это делает любой хороший слушатель. Ре! со своей стороны 
усиленно старается соблюсти условия сделки. Скажите, чего вы хотите, а Рет], 
как правило, «сообразит». (Если только вы не начнете нести бессмыслицу - ана- 
лизатор Рег] понимает Ре! значительно лучше, чем английский или суахили.) 


Но вернемся к существительным. Существительное может быть названием кон- 
кретного объекта или родового класса объектов – и само по себе оно не содержит 
информации о том, который из вариантов используется. Это различие проводит- 
ся в большинстве языков программирования, когда конкретная величина назы- 
вается значением, а общая — переменной. Значение где-то просто существует, 
а вот переменная в течение срока своей жизни связывается с одним или более зна- 
чений. Поэтому механизм интерпретации обязан отслеживать связь переменной 
с конкретными значениями. Интерпретатор может находиться в мозгу человека 
или в компьютере. 


Синтаксис переменных 


Переменная - это просто удобный способ хранить что-либо, именованный ящик, 
в котором программист может найти нечто требующееся ему, когда оно позднее 
понадобится. Как и в реальной жизни, есть ячейки хранения разного типа: одни 
являются, по существу, тайными, а другие открыты для всех. Некоторые храни- 
лища временные, а другие — более постоянные. Специалисты в области информа- 
тики любят обсуждать «области видимости» переменных, подразумевая под этим 
выражением именно то, что в нем сказано. В Рей имеются достаточно удобные 
средства решения проблем области видимости, с которыми читатель в будет 
иметь удовольствие познакомиться в должное время. Оно еще не наступило. (Лю- 


Пример многозначности слова «дор» и зависимости от контекста. Здесь оно использу- 
ется в роли глагола; в роли существительного; в составе идиомы, которая вообще пере- 
водится без применения слова «собака» (доб дауз, дождливые дни или дни повышен- 
ной влажности); в составном слове ӣобсаёсһег, которое может означать сотрудника ве- 
домства по надзору за дикими животными или выражать презрительное отношение 
к бестолковому политику; а также для описания сильной усталости (устал как соба- 
ка). – Прим. перев. 

Возможно, читатель устал как собака от всей этой лингвистической трескотни. Но мы 
хотим, чтобы было понятно, чем Регі, чтоб его собаки подрали, отличается от обычных 
компьютерных языков! 
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бопытные могут поискать прилагательные 10са1, пу, оиг и ѕїаїе в главе 27 либо за- 
глянуть в раздел «Объявления, ограниченные областью видимости» главы 4.) 


В данный момент полезнее провести классификацию переменных по типам дан- 
ных, которые они способны хранить. Как и в английском языке, в Ре! основное 
различие проводится между данными в единственном и во множественном чис- 
ле. Строки и числа являются данными в единственном числе, а списки строк или 
чисел — во множественном. (А когда мы доберемся до объектно-ориентированно- 
го программирования, вы обнаружите, что типичный объект выглядит единич- 
ным снаружи, но множественным изнутри — как группа студентов.) Переменную 
в единственном числе мы называем скаляром, а во множественном — массивом. 
Поскольку строка может храниться в скалярной переменной, можно написать 
такую, несколько более длинную (и снабженную комментариями) версию нашего 
первого примера: 


пу Фрһгаѕе = “Ном@у, мог18! \п"; # Создать новую переменную. 
ргіпї $рпгазе; н Вывести переменную. 


Прилагательное пу сообщает интерпретатору Регі, что $рпгазе – совершенно новая 
переменная, поэтому ему не нужно пытаться искать переменную с этим именем. 
Обратите внимание, что нам не пришлось предварительно определять, какой тип 
имеет переменная $рһгаѕе. Символ $ указывает Рег на то, что рігаѕе представляет 
собой скалярную переменную, 1.е. содержит единственное значение. Напротив, 
имн переменной-массива должно начинаться символом @. (Возможно, вам будет 
проще запомнить, что $ – это стилизованная буква «5», от «ѕсајаг», тогда как @- 
стилизованная «а», от «агтау».)! 


В Рей имеются некоторые другие типы переменных с такими непривлекательны- 
ми именами, как «хеш» (һаѕћ), «дескриптор» (Һара1е) и «запись таблицы имен» 
(ёуреғ1ођ). Как и в случае скаляров и массивов, переменным этих типов предше- 
ствуют забавные символы, которые более широко известны как разыменовываю- 
щие префиксы. В табл. 1.1 приводится полный список разыменовывающих пре- 
фиксов, которые могут вам встретиться: 


Таблица 1.1. Типы переменных и области их использования 


Символ | Пример | Что обозначает 


Скаляр $сепїѕ Отдельное значение (число или строку) 

Массив @1агде Список значений с числовым ключом 

Хеш у1птегезт | Группа значений со строковым ключом 
Подпрограмма &пом Фрагмент кода Рег|, который может быть вызван 


Турер1оЬ *51гиСк Все, что имеет имя Ѕїгиск 
Некоторые пуристы от языков программирования считают эти разыменовываю- 
щие префиксы причиной отвращения к Реп. Это поверхностный взгляд. У этих 
символов много достоинств, не последним из которых является возможность под- 
становки, или интерполяции (іпёегроіаііоп), этих символов в строки без всякого 


дополнительного синтаксиса. Кроме того, сценарии Рег! легко читать (тем, кто 


1 Это упрощенное изложение настоящей истории разыменовывающих префиксов, кото- 
рая будет рассказана в главе 2. 
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потрудился изучить Регі!), поскольку существительные отличаются от глаголов. 
В язык могут добавляться новые глаголы без ущерба для старых сценариев. (Мы 
уже говорили, что в Регі на этапе проектирования была заложена возможность 
развития.) И аналогия с существительными приведена не зря: есть масса приме- 
ров в английском и других языках, когда требуются грамматические маркеры 
существительных. Вот так мы думаем! (Как нам кажется.) 


Единственное число 


В приведенном выше примере мы видели, что скаляру можно присваивать новое 
значение с помощью оператора = подобно тому, как это делается во многих других 
языках программирования. Скалярным переменным можно присваивать скаляр- 
ные значения любого вида: целые числа, числа с плавающей запятой, строки и да- 
же такие эзотерические вещи, как ссылки на другие переменные или объекты. 
Есть много способов создания этих значений, которые должны присваиваться. 


Как и в командной оболочке ОМІХ!, можно использовать различные механизмы 
расстановки кавычек для создания значений разного вида. Двойные кавычки 
(аоцЫе сиоёеѕ) выполняют интерполяцию переменных? и интерполяцию обрат- 
ного слэша (например, превращение \п в символ перевода строки), тогда как оди- 
ночные кавычки подавляют интерполяцию. А обратные кавычки (наклоненные 
влево) вызывают выполнение внешней программы и возврат ее выдачи, которая 
перехватывается как одна строка, содержащая все строки выдачи. 


ту $апѕмег = 42; # целое число 

ту $р1 = 3. 14159265; # вещественное число 

ту $амосайоѕ = 6. 02е23; # экспоненциальная запись 

ту $рет = "Сате1"; # строка 

ту $5197 = “І 10%е му $реї”; # строка с интерполяцией 

пу $со$Е = ‘ТЕ соѕіѕ $100°; # строка без интерполяции 

ту $һепсе = $мпепсе, # значение другой переменной 

ту $за1за = $то1еѕ » $ауосайоѕ; # гастрохимическое выражение 

ту $ех1{ = ѕуѕтет( "мі $#і1е"); # числовой код результата выполнения команды 
му $см9 = ‘рмб`; # строка выдачи команды 


И хотя мы еще не рассказали о необычных значениях, следует указать, что ска- 
ляры могут содержать ссылки на другие структуры данных, в том числе подпро- 
граммы и объекты. 


пу $агу = \@туаггау; # ссылка на именованный массив 

ту $һ5һ = \Хтуһаѕһ; # ссылка на именованный хеш 

пу $306 = \ётуѕиб; # ссылка на именованную подпрограмму 
ту Фагу = [1,2,3,4,5]; # ссылка на анонимный массив 


1 Здесь и всюду, говоря «ОМ№МІХ», мы подразумеваем любую операционную систему, похо- 
жую на ОМХ, в том числе ВХР, Мас ОБ Х, Тапих, Зојагіѕ, АІХ и, конечно, ОМХ. 


2 Иногда создатели сценариев командной оболочки называют это «подстановкой», но мы 
предпочитаем сохранить это слово для использования в Регі в других целях. Поэтому, 
пожалуйста, называйте это интерполяцией. Мы используем этот термин в текстологи- 
ческом смысле («этот отрывок является гностической интерполяцией»), а не в матема- 
тическом («данная точка на графике получена интерполяцией между двумя другими 
точками»). 
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пу Фһһ = {Ма => 19, С1 => 35}; # ссылка на анонимный хеш 
пу $316 = ѕир { ргіпі $вїаїе }; # ссылка на анонимную подпрограмму 
пу $1190 = Сате1->пем(“Ате1іа”):# ссылка на объект 


н 


Когда создается новая скалярная переменная, но до того как ей присвоено значе. 
ние, она автоматически инициализируется значением ипіеї?, которое, как и следо- 
вало ожидать, означает «не определено» (ипдеѓіпед). В зависимости от контекста, 
неопределенное значение может интерпретироваться как пустое значение: “или 
0. В более общем случае, в зависимости от контекста использования, переменные 
автоматически интерпретируются как строки, числа или значения «фгце» (исти- 
на) или «Ёа1зе» (ложь), обычно называемые булевыми, или логическими значе- 
ниями. Вспомните, как важен контекст в естественном языке. В Ре! разные опе- 
раторы предполагают получение в качестве параметров различного вида одиноч- 
ных значений, и мы будем говорить, что данные операторы предоставляют для 
этих параметров скалярный контекст. Иногда мы будем более конкретно гово- 
рить, что оператор предоставляет числовой, строковый или логический контекст 
для этих параметров. (Ниже мы расскажем о списочном контексте, который про- 
тивопоставляется скалярному.) Рег! автоматически преобразует данные к виду, 
требуемому текущим контекстом, руководствуясь здравым смыслом. Предполо- 
жим, например, что вы сказали следующее: 


ту фсате15 = '123°; 
ргіпі фсате15 + 1, ”\п"; 


Первоначальным значением переменной $сапе15 является строка, но она преобра- 
зуется в число, чтобы можно было прибавить к ней единицу, а затем обратныс 
в строку, чтобы можно было вывести ее как 124. Символ перевода строки, “\п”, то- 
же находится в строковом контексте, но поскольку он изначально является стро- 
кой, преобразование не требуется. Обратите, однако, внимание на двойные ка- 
вычки: использование одиночных кавычек, т.е. ’\п’, привело бы к появлению 
строки из двух символов, а именно обратного слэша и «п», которая никак не мо- 
жет представлять перевод строки. 


Итак, в некотором смысле, двойные и одиночные кавычки предоставляют еще 
один способ уточнения контекста. Интерпретация содержимого строки в кавыч- 
ках зависит от того, какого вида кавычки используются. (Далее мы рассмотрим 
некоторые другие операторы, синтаксически работающие как кавычки, но ис- 
пользующие строку некоторым особым способом, например, для поиска по шаб- 
лону или подстановки. Все они тоже действуют как строки в двойных кавычках. 
Контекст двойных кавычек является в Регі «интерполирующим» и предоставля- 
ется многими операторами, которые совершенно не похожи на двойные кавычки.) 


Аналогично ссылка ведет себя как ссылка в «разыменовывающем» контексте и как 
обычная скалярная величина в других случаях. Например, можно сказать так: 


пу $1190 = Сате1->пем("Ате1іа”); 
1Р (пої $1190) { діє "аеаа сатет”; } 
фРідо->ѕаад1е(); 


Здесь создается ссылка на объект Сапе1, которая помещается в переменную $1100. 
В следующей строке мы проверяем значение $1190 как логической величины на 
равенство «гие» и возбуждаем исключительную ситуацию (т.е. жалуемся, что ве- 
личина не истинна); в данном случае это означает, что конструктор Сате1->пем не 
смог создать требуемый объект Сапе1. Однако в последней строке мы обращаемся 
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с $1100 как со ссылкой, вызывая метод ѕай1е() объекта, содержащегося в $1100 
и представляющего собой объект Сапе1, поэтому Рей ищет метод ѕайй1е() для объ- 
ектов Сате!. Подробнее об этом сказано ниже. Сейчас просто запомните, что в Рей 
важен контекст, поскольку благодаря ему Ре! узнает о ваших потребностях, не 
ожидая явных указаний, необходимых во многих других языках программиро- 
вания. 


Множественное число 


В некоторых типах переменных содержатся множественные значения, связан- 
ные вместе логически. В Рег] есть два типа многозначных переменных: массивы 
и хеши. Во многих случаях они ведут себя как скаляры: новые можно создать, 
например, с помощью объявления пу, и они автоматически инициализируются 
пустым значением. Но в отличие от скаляров, при присвоении значений много- 
значным переменным в правой части оператора присваивания контекст является 
списочным, а не скалярным. 


Массивы и хеши также различаются между собой. Массив следует использовать, 
когда нужно найти значение по его порядковому номеру. Хеш применяется, чтобы 
найти что-либо по названию. Эти два понятия дополняют друг друга. Часто можно 
наблюдать использование массива для перевода номера месяца в название и соот- 
ветствующего хеша для перевода названия месяца обратно в номер. (Однако хеши 
могут содержать не только числа. К примеру, можно создать хеш, который будет 
переводить названия месяцев в названия камней, соответствующих месяцам.) 


Массивы. Массив – это упорядоченный список скаляров, к которым обращаются 
по их местоположению в списке!. Список может содержать числа, строки или 
смесь того и другого. (Он может также содержать ссылки на вложенные массивы 
(субмассивы) и вложенные хеши (субхеши).) Чтобы присвоить массиву значение 
в виде списка, нужно просто объединить значения с помощью круглых скобок: 


пу @Поме = (“кушетка”, “стул”, “стол” печка") 


И наоборот, используя @ћопе в списочном контексте, например, в правой части 
присваивания списку, мы получим на выходе тот самый список, который ввели. 
Например, присвоить значения, взятые из массива, четырем скалярным пере- 
менным можно так: 


ту (Фротато, $11?1, $#епп15, $р1ре) = @һоте; 
Это называется списочным присваиванием. Логически оно происходит параллель- 
но, поэтому можно обменять значениями две переменные с помощью такой фразы: 
($а1рћһа, Фотеда) = (Фотеда, Фа1рна); 


Как и в языке С, нумерация элементов массивов начинается с нуля, поэтому, ра- 
ботая с элементами массива с первого по четвертый, следует обращаться к ним 
по индексам от 0 до 8.2 Индексы массивов заключаются в квадратные скобки, 


Или по ключу (порядковому номеру, нижнему инлексу). определяющему местополо- 
жение. Выберите вариант по душе. 


Если это кажется вам непривычным, считайте индекс смещением, т.е. числом предше- 
ствующих элементов массива. Очевидно, перед первым элементом нет других элемен- 
тов, поэтому его смещение равно 0. Так уж думают компьютеры. (Как нам кажется.) 
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[вот такие], поэтому при выборе отдельного элемента массива нужно ссылаться 
на него так — $попе[л], где п является значением индекса (на единицу меньшим 
номера элемента), который нам нужен. Посмотрите на следующий пример. По- 
скольку мы имеем дело со скалярным элементом, ему обязательно должен пред: 
шествовать символ $. 


Если вы хотите присваивать значения элементам массива по одному, приведен- 
ное выше списочное присваивание можно записать так: 


ту ©һоте; 

$һоте[0] = "кушетка": 
фһоте[ 1] = “стул”; 
фһоте[2] = “стол”; 
$һоте[31 = "печка"; 


Как видно из примера, переменные можно создавать с помощью директивы пу, не 
присваивая начальное значение. (Для отдельных элементов массива директива пу 
не используется, потому что массив уже существует и он сам знает, как создавать 
элементы по мере необходимости.) 


Поскольку массивы упорядочены, над ними можно выполнять различные полез- 
ные действия, такие как стековые операции риѕћ и рор. Стек, в сущности, являет- 
ся просто упорядоченным списком с началом и концом. Что особенно важно, 
с концом. Регі рассматривает конец массива как вершину стека. (Хотя большин- 
ство программистов на Рег! представляют себе массивы горизонтальными после 
довательностями, у которых вершина стека справа.) 


Хеши. Хеш представляет собой неупорядоченный набор скаляров, к которым об- 
ращаются по некоторому строковому значению!, связанному с каждым скаля- 
ром. По этой причине хеши часто называют ассоциативными массивами. Но это 
слишком длинное название для ввода с клавиатуры, а упоминаются ассоциатив- 
ные массивы столь часто, что мы решили дать им какое-нибудь краткое и броское 
название. Другой причиной, по которой мы выбрали название «хеш», было жела- 
ние подчеркнуть тот факт, что подобные массивы не упорядочены. (Так совпало, 
что в их внутренней реализации используется поиск по хеш-таблице, в результа- 
те чего работа с ними происходит столь быстро вне зависимости от числа храни- 
мых значений.) Однако применить к хешу операцию риѕћ или рор нельзя: это не 
имеет смысла. У хеша нет начала и конца. Тем не менее хеши — это невероятно 
мощный и полезный инструмент. Пока вы не начали думать на языке хешей, вы, 
в сущности, не начали думать на Рен. На рис. 1.1 показаны упорядоченные эле- 
менты массива и неупорядоченные (но поименованные) элементы хеша. 


Поскольку ключи для хеша не задаются автоматически порядком значений, при 
заполнении хеша необходимо задавать как значение, так и ключ. Можно при- 
сваивать хешу список, так же как и массиву, но при этом каждая пара элементов 
списка будет интерпретироваться как ключ и значение. Поскольку мы работаем 
с парами элементов, имена хешей помечаются разыменовывающим префиксом % 
(Если внимательно посмотреть на символ %, можно заметить ключ и значение, 
разделенные косой чертой. Если не получается, попробуйте прищуриться.) 


' Или по ключу (порядковому номеру, нижнему индексу), определяющему местополо- 
жение. Выберите вариант по душе. 
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оыопдбау 


Рис. 1.1. Массив и хеш 


Предположим, вам требуется переводить сокращенные названия дней в соответ- 
ствующие полные названия. Можно создать такое списочное присваивание: 


пу %10подау = (”Вс", “Воскресенье” “Пн” “Понедельник “Вт” Вторник’ 
“Ср”. "Среда", “Чт”. “Четвер” “Пт” 
“Пятница”, "С6`, “Суббота”); 


Читать такое довольно трудно, поэтому Ре! предоставляет последовательность 
символов => (знак «равно», знак «больше») в качестве разделителя, альтернатив- 
ного запятой. С использованием этой синтаксической поблажки (и творческого 
форматирования) становится значительно легче различать, какие строки явля- 
ются ключами, а какие — связанными с ними значениями: 


пу Х1оподау = ( 
"Вс” => “Воскресенье”, 
“Пн” => “Понедельник”, 
"Вт" => “Вторник”, 
“Ср” => “Среда”, 
“Чт” => “Четверг”, 
“Пт” => “Пятница”, 
“Сб” => "Суббота", 

99 


Выше мы видели, что возможно присвоение списка хешу, но верно и обратное: 
хеш, упомянутый в списочном контексте, преобразуется обратно в список пар 
«ключ/значение», правда, в причудливом порядке. Иногда бывает полезно. Чаще 
требуется извлечь из хеша список одних ключей, для чего применяется функция 
с уместным названием кеуз. Список ключей тоже не упорядочен, но при желании 
его легко можно отсортировать с помощью столь же уместно названной функции 
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ѕогї. После этого упорядоченные ключи можно использовать для извлечения со- 
ответствующих значений в требуемом порядке. 


Поскольку хеш — довольно причудливая разновидность массива, доступ к отдель- 
ному элементу хеша осуществляется путем помещения ключа в фигурные скобки 
(причудливые скобки, которые известны как «завитушки»!). Поэтому если, ска- 
жем, требуется найти в вышеприведенном хеше значение, ассоциированное со 
средой (Ср), следует использовать $10п9дау{"Ср"}. Еще раз обратите внимание, что 
мы имеем дело со скалярной величиной, поэтому идентификатор начинается сим- 
волом $, а не %; последний указывал бы на весь хеш целиком. 


Если смотреть с позиций лингвистики, закодированная в хеше связь аналогична 
родительному падежу или притяжательному местоимению, как слово «оѓ» в анг- 
лийском языке или как «5». Женой Адама является Ева, поэтому мы пишем: 


ту %міғе; 
ФміҒе{"Адам”} = "Ева"; 


Сложности 


Массивы и хеши являют собой прелестные, простые, плоские структуры данных. 
К несчастью, окружающий мир не всегда идет навстречу нашим попыткам чрез- 
мерного упрощения. Иногда приходится создавать не столь прелестные, простые 
и плоские структуры данных. Рей допускает это, «делая вид», что сложные вели- 
чины на самом деле являются простыми. Иначе говоря, Рег] позволяет манипули- 
ровать простыми скалярными ссылками, которые указывают на сложные масси- 
вы и хеши. В естественном языке мы занимаемся этим постоянно, когда исполь- 
зуем простое существительное в единственном числе, например, «правительство» 
для обозначения объекта, который исключительно запутан и непостижим. Номи- 
мо всего прочего. 


Расширим наш предыдущий пример, предположив, что вместо жены Адама мы 
хотим поговорить о жене Иакова. Известно, между тем, чтоу Иакова было четыре 
жены. (Не пытайтесь повторить этот трюк.) Пытаясь представить это на Рен, мы 
оказываемся в необычном положении: требуется притвориться, что четыре жены 
Иакова в действительности являются одной женой. (Этот трюк тоже повторять не 
стоит.) Читатель может решить, что допустима такая запись: 


$фитте{“Иаков”} = (“Лия , “Рахиль Валла Зелфа`\ # НЕВЕРНО 


Но в результате мы не получим того, что требуется, потому что в Рей] даже скобки 
и запятые бессильны превратить список в скаляр. (Скобки предназначены для син- 
таксического объединения, а запятые — для синтаксического разделения.) Вместо 
этого необходимо явно сообщить Регі, что список требуется представить в виде ска- 
ляра. Оказывается, что достаточной силой для этого обладают квадратные скобки: 


ФміғҒе{ "Иаков" } = [“Лия”. “Рахиль”, `Валла”, Зелфа”] # ок 


Эта команда создает анонимный массив и помещает ссылку на него в элемент хе- 
ша $м1Ге{"Иаков"}. В результате получаем именованный хеш, содержащий ано- 
нимный массив. Таким способом Ре! работает с многомерными массивами и вло- 


1 Разумеется, речь об английском языке, где для обозначения фигурных скобок сущест- 
вуют слова бгасе(ѕ), сийу Бгасе(в)/си у ргаскеїѕ или просто сигііев (завитушки, куд- 
ряшки). — Прим. ред. 
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женными структурами данных. Как и в обычных массивах и хешах, можно при- 
сваивать значения отдельным элементам следующим образом: 


$міғе{ "Иаков" }01 = "Лия"; 

$1 Ре { "Иаков" }[1] = "Рахиль" 
$м1Ре{"Иаков"}[2] = "Валла"; 
Фиг Ғе{ "Иаков" }3] = “Зелфа"; 


Как видите, это похоже на многомерный массив, одним индексом которого явля- 
ется строка, а другим — число. Чтобы показать нечто более похожее по структуре 
на дерево, типа вложенных структур данных, предположим, что мы хотим пере- 
числить не только жен Иакова, но и всех сыновей каждой из его жен. В этом слу- 
чае надо обращаться с хешем как со скаляром. Для этого можно использовать 
скобки. (Внутри каждого значения хеша мы, как и раньше, будем применять для 
представления массивов квадратные скобки. Но теперь у нас массив, содержа- 
щийся в хеше, содержащемся в хеше.) 


Му %К193_оЁ м1 Ре, 
$к19$_оЁ міте{ "Иаков" } = { 
“Лия” => ["Рувим", “Симеон”, `Левий“, “Иуда”, ‘`Иссахар“, “Завулон '] 
“Рахиль” => ["Иосиф", “Вениамин” ] 
"Валла" => [“Дак”, “Һеффалим” ] 
“Зелфа” => [“Гад”, Асир“], 
} 


Это более или менее эквивалентно следующему: 


пу К105 ОЁ мае, 


$195 ОҒ міғе{ “Иаков” } {"Лия"} [0] = Рувим”; 
$кібѕ оѓ мі ғе{ "Иаков" } { "Лия" } [1] = “Симеон”; 
$кібѕ оѓ мі ғе{ "Иаков" } { "Лия" }[2] = "Левий" 
$кій5 оғ міғе{ “Иаков” } { "Лия" }[3] = “Иуда”: 
$к19$_ ОҒ мі ғе{ "Иаков" } {"Лия"} [4] = “Иссахар” 
$к105 оғ міғе{ “Иаков” } { "Лия" } [5] = "Завулон": 


$к108_0# ма ғе{ "Иаков" } { "Рахиль" }[0] = “Иосиф”, 
$к108 оғ м1 ғе{ "Иаков" } { "Рахиль" }[11 = "Вениамин; 
$кіаѕ_оѓ_міғе{ "Иаков" }{ "Валла" }[0] = “Дан”; 
$кідѕ оғ мі ғе{ "Иаков" } { "Валла"}[1] = "Неффалим"; 
$к105 оғ міҒе{"Иаков” } {“Зелфа“}[0] = "Гад"; 
фкій8 ОҒ міғе{ “Иаков” } {"Зелфа"}[1] = "Асир" 


Как видите, добавление нового уровня во вложенную структуру данных похоже 
на добавление еще одного измерения в многомерный массив. Рег! позволяет про- 
граммисту применять любую умозрительную модель, при этом внутреннее пред- 
ставление не меняется. 


Важный момент: Рег! допускает считать сложную структуру данных простым 
скаляром. На этой простой разновидности инкапсуляции основывается вся объ- 
ектно-ориентированная структура Ре]. Когда выше мы вызвали конструктор 
для Сапе1 в виде: 


пу $1100 = Сате1->пем("Ате1іа”) 


то создали объект Сапе1, представленный скаляром $1100. Но внутреннее строение 
Сате1 является более сложным. Как воспитанные объектно-ориентированные 
программисты, мы не должны интересоваться содержимым объектов Сапе] (если 
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только перед нами не поставлена задача реализации методов класса Сапе1). Но 
обычно объект типа Сате1 состоит из хеша, содержащего атрибуты конкретного 
объекта Сапе1, такие как кличка (в данном случае "Апе1:а", а не "Ғійо") и количест- 
во горбов (которое мы не задали, но по умолчанию, вероятно, установлен один, 
как на обложке этой книги). 


Простые вещи 


Если у вас не закружилась слегка голова после чтения предыдущегс параграфа, 
ваша голова необычная. Как правило, люди не любят иметь дело со сложными 
структурами данных, будь они правительственными или генеалогическими. По- 
этому вестественных языках есть много способов сделать вид, что никаких слож- 
ностей нет. Многие из них связаны с заданием темы (ќорісаһғаёіоп), причудли- 
вым лингвистическим термином, означающим соглашение с кем-то относитель- 
но того, о чем пойдет речь (или путем исключения того, о чем речь, вероятно, не 
пойдет). В языке это происходит на нескольких уровнях. На верхнем уровне мы 
разделяемся на различные субкультуры, интересующиеся различными подтема- 
ми и устанавливающие субъязыки, посвященные разговорам на такие подтемы. 
Жаргон медицинской клиники («нерастворимый фактор асфиксии» – 111 1ззомЫе 
азррух1ап@ отличен от жаргона кондитерской фабрики («долгоиграющий гоб- 
стоппер» — еуепаѕііпе ғорѕіоррег). В основном мы автоматически переключаем 
контексты при переходе с одного жаргона на другой. 


На разговорном уровне переключение контекста должно производиться более яв- 
ным образом, поэтому в нашем языке есть много способов сообщить, о чем мы со- 
бираемся говорить. Мы озаглавливаем книги и разделы, из которых они состоят. 
В свои предложения мы вставляем витиеватые фразы, такие как «касательно ва- 
шего последнего запроса» или «для каждого Х». Обычно, однако, мы просто про- 
износим нечто вроде: «Ну, знаешь, эта висюлька, которая болтается у тебя в зад- 
ней части горла?» 


Рей также предлагает несколько способов задать тему. Одним из важных спосо- 
бов является объявление пакета, раскаде. Предположим, что мы хотим погово- 
рить на Рег1 о верблюдах. Скорее всего, следует начать модуль Сапе] словами: 


раскаде Сате1; 


У этого объявления несколько примечательных последствий. В частности, начи- 
ная с этого места, Ре будет считать все неопределенные глаголы и существи- 
тельные относящимися к Сапе1. Он делает это, автоматически предваряя все ғло- 
бальные имена префиксом Сапе1::2. Поэтому если сказать: 


раскаде Самет; 
оиг $1190 = &Ғѓесһ(); 


1 Отличительной особенностью этих кондитерских изделий является их твердость; раз- 
меры и ингредиенты могут быть самыми разными. – Прим. ред. 


2 Объявлять глобальные переменные можно с помощью декларации оуг, которая очень 
похожа на пу, но означает, что переменная является разделяемой, или совместно ис- 
пользуемой. Переменные пу не могут использоваться совместно и недоступны за преде- 
лами текущего блока. Если сомневаетесь, используйте объявление пу вместо оџг, по- 
скольку лишние глобальные имена толькс захламляют наш мир и приводят других 
в замешательство. 
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то настоящим именем $1190 будет $Сате1::ѓійо (а настоящим именем ёЁеїсћ будет 
&Сате1::Ретсп, но пока мы не будем говорить о глаголах). Это означает. что если 
в другом модуле сказано: 


раскаде 009; 
оиг $1140 = ё&Ғеїсһ(); 


то Реп не напутает, поскольку настоящим именем этой $1140 будет $009: :1190, ане 
$Сате1·`Ғідо. «По-научному» говорится, что пакет устанавливает пространство 
имен (патеѕрасе). Количество пространств имен не ограничено, но поскольку од- 
новременно нельзя находиться сразу в нескольких, то можно притвориться, что 
остальных пространств имен не существует. Благодаря этому пространства имен 
упрощают жизнь. Упрощение основывается на притворстве. (Так же, конечно, 
как и чрезмерное упрощение, которым мы занимаемся в данной главе.) 


Содержать в порядке существительные важно, но так же важно содержать в по- 
рядке глаголы. Прекрасно, что &Сате1::Гефсй нельзя спутать с &000::Ѓеїсћ в про- 
странствах имен Сапе] и 009, но действительно замечательно в пакетах то, что они 
классифицируют глаголы так, что ими могут пользоваться другие пакеты. Когда 
мы говорим: 


ту $1190 = Сате1->пем("Ате1іа"); 


то фактически применяем глагол &пем из пакета Сапе1, и полным именем этого 
глагола является &Сате1 : :пем. А когда мы говорим: 


ФРідо->ѕадд1е(); 


то вызываем метод &Сапе1::ѕадд1е, поскольку переменная $1100 помнит, что она ука- 
зывает на Сапе1. Вот так устроено объектно-ориентированное программирование. 


Словами раскаде Сапе1 мы начинаем новый пакет. Но иногда требуется взять су- 
ществительные и глаголы из уже существующего пакета. Рег! позволяет сделать 
это посредством объявления изе (использовать), которое обеспечивает не только 
заимствование глаголов из другого пакета, но и загрузку указанного модуля 
с диска. На деле, необходимо сказать что-то вроде: 


изе Сате1, 
перед тем как сказать: 
ту $11900 = Сате1->("Ате1іа”); 


потому что иначе Рег] не будет знать, что такое Сапе]. 


Интересно, что разработчику, в сущности, не требуется знать, что такое Сапе1, при 
условии, что кто-то другой может написать модуль Сапе! вместо него. Еще лучше, 
если кто-то уже написал модуль Сате1. Можно утверждать, что мощь Рег! заклю- 
чается не в самом Рей, а в СРАМ (Сотргеһепѕіуе Рег! Атсһіуе М№ъеімогЕ; см. гла- 
ву 19) – архиве, содержащем мириады модулей для самых разных задач, от реше- 
ния которых вы освобождаетесь. Вам нужно лишь загрузить любой понравив- 
шийся модуль и сказать: 


изе Зоте: :Соо1: :Моди1е; 


После этого можно использовать глаголы из этого модуля так, как это уместно 
в контексте разговора на определенную тему. 
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Подобно тому, как это происходит в естественном языке, установка темы в Рег] 
«искажает» язык, который будет использоваться с данного места и до конца об- 
ласти видимости. На практике некоторые встроенные модули вообще не вводят 
в действие новые глаголы, а только деформируют язык Ре! | разными полезными 
способами. Эти особые модули мы называем прагмами (ргахтаз, см. главу 29). 
Например, часто применяется прагма ѕЅїгісї: 


иѕе ѕігісї; 


Действие модуля ѕїг1сї состоит в ужесточении некоторых правил, в результате 
чего чаще приходится указывать различные вещи, о которых в другом случае 
Рей догадывался бы сам, например, об областях видимости переменных!. Явные 
указания выгодны при работе над большими проектами. По умолчанию Ре! оп- 
тимизирован для маленьких проектов, но в случае применения прагмы ѕїігісї 
становится подходящим инструментом и для больших проектов, требующих 
лучшего сопровождения. Поскольку прагму $їгісі можно добавить в любой мо- 
мент, Рей хоропю справляется с разрастанием маленьких проектов в большие, 
даже если поначалу это не предполагалось. Как обычно и бывает. 


Вместе с языком Рег развивается и его сообщество, и по мере развития изменяют- 
ся представления сообщества о том, как должен вести себя Рей по умолчанию. 
(Что противоречит желанию, чтобы Рег] вел себя так же, как прежде.) Так, на- 
пример, большинство программистов на Рей теперь думают, что всегда следует 
вставлять изе ѕїгісї в начало программы. С течением времени происходит накоп- 
ление таких «культурных» прагм, деформирующих язык. Поэтому была добавле- 
на другая встроенная прагма, состоящая исключительно из номера версии Рей, 
являющаяся своеобразной «метапрагмой», сообщающей интерпретатору Регі, что 
он должен действовать как более современный язык: 


изе \5. 14, 


Данное конкретное объявление активизирует сразу несколько прагм, включая 
и5е ѕ1гісі;2 оно также включает некоторые новые функции, такие как глагол ѕау, 
который (в отличие от ргіпї) автоматически добавляет перевод строки. Соответст- 
венно, наш самый первый пример можно записать так: 


изе у. 14; 
ѕау "Ному, мог1а'”, 


Все примеры в этой книге написаны в предположении, что используется версия 
Рей у5.14; мы постараемся не забывать включать объявление џѕе \5.14 в листинги 
полных программ, но при демонстрации фрагментов мы будем исходить из того, 
что вы уже добавили это объявление самостоятельно. (Если вы пользуетесь не по- 
следней версией Регі, некоторые из наших примеров могут оказаться неработоспо- 
собными. В случае с командой зау просто замените ее командой ргіпї, добавив сим- 


1 В частности, инструкция изе ѕігісї требует, чтобы вы использовали директивы пу, 
ѕїате или оџг в объявлениях переменных, иначе будет предполагаться, что необъявлен- 
ные переменные являются переменными пакета, что может привести к неприятно- 
стям. Она также запрещает использование различных конструкций, за долгие годы 
существования которых выяснилось, что они чреваты ошибками. 


2 Неявная поддержка прагмы ѕїгісї была добавлена в версии у5.12. Обратите также вни- 
мание на прагму ѓеаїџге, описываемую в главе 29. 
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вол перевода строки, но лучше будет обновить версию Рец. Чтобы использование 
команды зау не вызывало проблем, вы должны сказать как минимум изе у5.10.) 


Глаголы 


Как это свойственно обычным «повелительным» языкам программирования, 
многие глаголы Рег являются командами: они приказывают интерпретатору Ре" 
что-либо выполнить. С другой стороны, что характерно для естественных языков, 
значения глаголов Рей имеют тенденцию «разбегаться» в разных направлениях 
в зависимости от контекста. Высказывание, начинающееся с глагола, обычно яв- 
ляется чисто повелительным и выполняется исключительно ради своих побоч- 
ных эффектов. (Иногда мы называем такие глаголы процедурами (ргоседигез), 
особенно если они определяются пользователем.) К, часто встречающимся встро- 
енным командам относится команда ѕау (мы с ней уже знакомы): 


ѕау "Женой Адама является $і Ғе{ `Адам'}. “: 
Ее побочный эффект выражается в появлении желаемого вывода: 
Женой Адама является Ева. 


Но кроме повелительного существуют и другие «наклонения». Некоторые глаго- 
лы применяются в вопросительных фразах и полезны в условных операторах, та- 
ких как оператор іё. Другие глаголы транслируют свои входные параметры в воз- 
вращаемые значения, подобно тому как рецепт описывает способ превращения 
исходных ингредиентов в нечто (как можно надеяться) съедобное. Мы склонны 
называть такие глаголы функциями ({ипсНопз) из уважения к поколениям мате- 
матиков, которым неизвестно значение слова «функциональный» в повседнев- 
ном языке. 


Примером встроенной функции служит функция экспоненты: 
ту $е = ехр(1), #2 718281828459 или окопо того 


Однако в Рег] не проводится жесткого разделения между процедурами и функ- 
циями. Читатель обнаружит, что эти термины используются взаимозаменяемым 
образом. Иногда глаголы называются также операторами (если они встроенные) 
или подпрограммами (если они определены пользователем)! Называйте их как 
угодно, но все они возвращают значение, которое может быть осмысленным или 
нет и которое можно по необходимости игнорировать. 


По ходу нашего изложения вам встретятся и другие примеры того, как Рей ведет 
себя аналогично естественным языкам. Но можно взглянуть на Рег] и с других 


Исторически сложилось так, что Рег требовал указания символа єамперсанда» (8) при 
любых вызовах подпрограмм, определенных пользователем (смотри выше $1140 = 
&Гетсн();). Но в Рен версии 5 использование амперсанда стало необязательным, поэтому 
при обращении к глаголам, определенным пользователем, теперь допускается такой 
же синтаксис, как и со встроенными глаголами ($1190 = Тетси();}. Мы по-прежнему ис- 
пользуем амперсанд, говоря об имени подпрограммы, например, при получении ссыл- 
ки на нее ($ѓеісһег = \8&Ретсн;). С позиций лингвистики можно рассматривать формат 
&еїсһ с амперсандом как инфинитив, «іо ѓеісһ», или аналогичную форму «до Рефсй». Но 
мы редко говорим «до Ѓеёсһћ», если можнс сказать просто «ѓеісћ». Это и есть действи- 
тельная причина того, что мы отбросили обязательный амперсанд в Рег! 5. 
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точек зрения. Мы уже «втихомолку» ввели некоторые обозначения из языка ма- 
тематики, такие как индексы, сложение, функция экспоненты. Но Рег! является 
также языком управления, связующим языком (1ае Іапсиоаре), языком создания 
прототипов, языком обработки текста, обработки списков и объектно-ориентиро- 
ванным языком — помимо всего прочего. 


Рег] — это также старый добрый язык программирования для компьютеров. 
С этой точки зрения мы и рассмотрим его теперь. 


Пример вычисления среднего 


Предположим, что вы преподаете Рей группе студентов и пытаетесь решить, как 
выставлять оценки. У вас есть результаты сдачи экзаменов каждым студентом, 
причем результаты идут в произвольном порядке. Требуется получить список, объ- 
единяющий оценки каждого студента и дополненный средним баллом. И у вас есть 
текстовый файл (оригинально названный #гадез — оценки), который выглядит так: 


№е1 25 

Веп 76 
СІетепііпе 49 
№гт 66 

Сһгіѕ 92 

доод 42 

Саго1 25 

Веп 12 
СІетептіпе 0 
№гт 66 


С помощью следующего сценария можно собрать вместе все оценки, определить 
средний балл для каждого студента и вывести все это в алфавитном порядке. 
В программе наивно предполагается, что в группе нет двух студенток с именем 
Саго!. А именно, если есть запись, относящаяся ко второй Саго], программа ре- 
шит, что это еще одна оценка для первой Саго! (не путать с первой №) 


Кстати, номера строк не являются частью программы, несмотря на возможное 
сходство с ВАС в других аспектах. 


#1 /иѕг/Юіп/рег1 
иѕе у5. 14; 


1 
2 

З 

4 ореп(бААВЕЅ, "<:0##8“, “дгадез”) ог біе "Невозможно открыть дгадез: $! \п” 
5 ріптоде($ТроуТ, `:и#8`) 
6 

Т 

8 


пу %#9гадез; 

мһі1е (ту $11пе = <бНАОЕЗ>) { 
9 пу ($ә№идепї, $дгаде) = 5р11ї(" “, $1іпе); 
10 фагадеѕ { $51ибепі) = $9габе ” 7; 
11 } 


12 
13 Рог пу $этидепт (ѕогї кеуз %9гадез) { 
14 ту $ѕсогеѕ = 0; 


15 пу $Тота1 = 0; 
16 ту @вдгадез = зр111(” `, $дгадеѕ{$5ї10депї}); 
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17 Гог ту $9гаде (@дгадез) { 


18 ф+ота1 += $дгаде; 

19 фѕсогеѕ++ 

20 } 

21 ту Фауегаде = $1ота1 / $5согез; 

22 ргіпї "$этидепт: $д9гадез{$зтиаеп{}\{Среднее: $ауегаде\п”; 
23 } 


Пока у вас не разбежались глаза, мы лучше сразу отметим, что в этом примере 
демонстрируется многое из того, о чем мы уже рассказывали, аеще много такого, 
что мы объясним вскоре. Но если взглянуть на этот пример несколько издалека, 
то можно обнаружить некоторые интересные закономерности. Попробуйте сами 
догадаться о том, что здесь происходит. а позднее мы сообщим, подтвердились ли 
эти догадки. 


Мы бы посоветовали вам попробовать запустить этот пример на выполнение, но 
вы, вероятно, еще не знаете, как это делается. 


Как это делается 


Ох, сейчас вы, наверное, размышляете, как же запустить программу на Рец. Ко- 
роткий ответ состоит в том, что нужно подать ее на вход интерпретатора языка 
Рей, который, по счастливому совпадению, носит название регі. Длинный ответ 
начинается так: «ТБеге’5 Моге Тһап Опе Мау То Ро В» – есть несколько способов 
сделать это.! 


Первый способ запустить ре! (как правило, работающий в любой операционной 
системе) > это просто вызвать регі явным образом из командной строки.? Если вы 
выполняете что-то очень простое, можно использовать ключ -е (в следующем 
примере символ % представляет стандартное приглашение оболочки. поэтому его 
набирать не нужно). В ОМТХ, к примеру, можно ввести: 


% рег1 -в ‘рг1пе "Не110, мог14! \п”; ° 


В других операционных системах могут понадобиться некоторые махинации 
с кавычками. Но базовый принцип везде одинаковый: попытаться уместить все, 
что требуется сообщить Ре!1, примерно в 80 знаков.3 


Для создания более длинных сценариев можно с помощью своего любимого тек- 
стового редактора (или любого другого текстового редактора) поместить все ко- 
манды в файл, а затем, предполагая, что вы назвали этот файл агаааноп. сказать: 


Х рег1 дгада оп 


Это девиз Ре!|, и вам неоднократно придется слышать его, если только вы не являетесь 
местным экспертом в Регі, и тогда вам неоднократно придется его произносить. Иногда 
его сокращают до ТМТОУ/ ТИТ, что произносится «Тим Тоуди». Но каждый волен про- 
износить это так, как ему больше нравится. В конце концов, ТМТОУГТИТ. 


В предположении, что ваша система имеет интерфейс командной строки. Если у вас 
его нет, пора сделать апгрейд. 


Такого типа сценарии часто называют «однострочниками» («опе-Ппегз»). Попав в ком- 
панию других программистов на Рег, вы обнаружите, что некоторые из них увлекают- 
ся созданием замысловатых однострочников. Из-за этих махинаций злые языки ино- 
гда называют Ре! языком «только для записи» (мтгНе-опу1апеиаяе). 
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При этом интерпретатор Ре! по-прежнему вызывается явным образом, но, по 
крайней мере, не приходится каждый раз вводить все в командной строке и не 
нужно возиться с кавычками, чтобы удовлетворить требованиям оболочки. 


Удобнее всего вызвать сценарий, просто указав его имя (или щелкнув на нем) и пре- 
доставив операционной системе найти требуемый интерпретатор. В некоторых сис- 
темах существуют способы связывания определенных расширений файлов или ка- 
талогов с теми или иными приложениями. В этих системах нужно произвести дей- 
ствия, необходимые для связывания сценария Рец с интерпретатором ре. В систе- 
мах ОМІХ, поддерживающих нотацию # (нотация «ѕћерапо»), а таковыми в наше 
время является большинство систем ОМТХ, можно с помощью специальной пер- 
вой строки сценария указать операционной системе, какую программу она должна 
запустить. Введите в качестве первой строки нашего примера нечто аналогичное 


в! /иѕг/біп/регі 


(Если рей у5.14 находится не в /иѕг/біп, то нужно соответствующим образом из- 
менить строку #!.1) После этого вам требуется лишь сказать: 


х дгада+тіоп 


Разумеется, это не сработало, поскольку вы забыли сделать сценарий выполняе- 
мым файлом (см. страницу руководства сћтоа(1)) и добавить его в маршрут поис- 
ка РАТН.? Если его нет в переменной РАТН, необходимо указать полное имя фай- 
ла, чтобы операционная система знала, где найти ваш сценарий, например так: 


х /поте/ѕпагоп/оіп/дгадаїт1оп 


Наконец, если вам настолько не везет, что у вас стоит древняя система ОМІХ, ко- 
торая не поддерживает волшебную строку #!, или путь к вашему интерпретатору 
длиннее 32 символов (встроенный предел многих систем), вы можете обойти эти 
ограничения таким способом: 


#1 /ріп/ѕһ -- # рег1, остановить цикл 
в\уа1 ‘ехес /иѕг /ріп/рег1 -9 $0 ${1+"$@" }° 
ЇР 0; 
В некоторых операционных системах требуется какая-нибудь разновидность это- 
го приема, чтобы справиться с /біл/сѕћ, РСІ, СОММАМР.СОМ или другим ин- 
терпретатором командной строки, устанавливаемым по умолчанию. Посоветуй- 
тесь с Местным Экспертом. 


На протяжении всей этои книги мы будем использовать просто й! /иѕг/о1п/рег1 для 
представления всех этих обозначений, но теперь вы знаете, что под этим имеется 
в виду. 


1 Если вы пользуетесь старой версией /иѕг/біл/регі, можно скомпилировать новук вер- 
сию и поместить ее в другой каталог, например /иѕг/осаі/іп, но не забудьте при этом 
исправить путь в строке #!. 


2 Вбольшинстве случаев, после того как файлу назначены атрибуты исполнения (той же 
командой сһтоб +х), если выполнить дгайбаїіоп в том каталоге, где файл хранится, этот 
файл будет отправлен на исполнение. Иначе говоря, его необязательно помещать в ката- 
лог, упомянутый в переменной среды РАТН. Второе, что тут следует отметить, — в Міп- 
домѕ фокус с спой вообще не работает (ввиду отсутствия сһпод). Там следует сопоста- 
вить расширение (.р! или -рег1) интерпретатору Рег]. – Прим. науч. ред. 
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Случайный совет: когда будете писать пробный сценарий, не называйте его {ез+. 
В системах ОМХ имеется встроенная команда {езт, которая, скорее всего, и будет 
выполнена вместо вашего сценария. Попробуйте лучше назвать сценарий гу. 


Теперь, когда вы знаете, как запустить свою собственную программу на Реп (не 
путать с программой рег!), вернемся к нашему примеру. 


Дескрипторы файлов 


Если только вы не занимаетесь моделированием философа-солипсиста с помощью 
методов искусственного ин1еллекла, вашей программе требуются какие-то средст- 
ва общения с внешним миром. В строках 4 и 8 нашего Примера вычисления сред- 
него встречается слово СВАПЕ5, которое иллюстрирует еще один из типов данных 
Рен, а именно дескриптор файла (Шевапа@е). Дескриптор файла — это просто имя, 
которое присваивается файлу, устройству, сокету или конвейеру и помогает вспом- 
нить, о чем из перечисленного вы говорите, а также скрыть некоторые сложные 
вещи типа буферизации. (Во внутренней реализации дескрипторы файлов анало- 
гичны потокам (ѕігеаѕ) языков типа С++ или каналам ввода/вывода в ВАЅІС.) 


Дескрипторы файлов облегчают получение входных данных и отправку выход- 
ных в различные места. Хорошим связующим языком (&оџе Іапсџаее) Регі делает 
отчасти то, что он умеет одновременно общаться со многими файлами и процесса- 
ми. Наличие удобных символических имен для различных внешних объектов — 
один из элементов хорошего связующего языка! 


Создание дескриптора файла и закрепление его за файлом выполняется с помощью 
функции ореп. Функция ореп принимает по меньшей мере два параметра: дескрип- 
тор файла и имя файла, с которым его нужно связать. Ре предоставляет также 
несколько предварительно определенных (и предварительно открытых) дескрип- 
торов файлов. ЭТОМ — это обычный канал ввода для вашей программы, а 5Т000Т ~ 
это для нее обычный канал вывода. ЭТОЕАВ представляет собой дополнительный 
канал вывода, позволяющий программе отпускать ехидные ремарки, пока она 
преобразует (или пытается преобразовать) ваши входные данные в выходные.? 
В строках 4и 5 нашей программы мы также сообщили нашему новому дескрипто- 


1 Вот еще аспекты, благодаря которым Рен! является хорошим связующим языком: он 
способен обрабатывать не только символы АЗСП, его можно встраивать, а с помощью 
модулей расширения в него можно встраивать другие компоненты. Он лаконичен и лег- 
ко интегрируется с другими платформами. Он, можно сказать, ответственно подходит 
к вопросам экологии. Он может вызыватьсғ различными способами (как было показа- 
но выше). Но главное, сам язык не настолько строго структурирован, чтобы нельзя бы- 
ло каким-то способом решить стоящую перед вами проблему. Здесь снова проявляется 
уже знакомый нам принцип ТМТОМҮТИ. 


Обычно эти дескрипторы файлов привязаны к терминалу, чтобы можно было ввести 
данные с клавиатуры и посмотреть результат на экране, но можно связать их и с фай- 
лами (или чем-то еще). Рег предлагает эти предопределенные дескрипторы, поскольку 
они уже тем или иным способом созданы операционной системой. В О МХ процессы 
наследуют стандартные устройства ввода, вывода и вывода ошибов. от родительского 
процесса, которым обычно является оболочка. Одной из задач оболочки является на- 
стройка этих потоков ввода/вывода таким образом, чтобы порожденному процессу не 
припглось о них беспокоиться. 
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ру СААрЕЅ и существующему дескриптору 5ТООЦТ, что текст будет представлен в ко- 
дировке ОТЕ-8, которая обычно используется для представления текста Юникода. 


Поскольку посредством функции ореп можно открывать дескрипторы файлов 
в различных целях (для ввода, вывода, конвейеризации), необходимо иметь воз- 
можность указать требуемый режим. Аналогично тому, как это делается в ко- 
мандной строке, нужно просто добавить символы к имени файла. 


ореп(ЅЕЅАМЕ, "имя файла") # чтение существующего файла 

ореп(ЗЕЗАМЕ, < имя файла”) # (то же, но явным образом) 

ореп(5ЕЗАМЕ, "> им? файла”) # создать файл и производить в него запись 
ореп(ЗЕЗАМЕ, ">> имя файла”) # дописывание в конец файла 
ореп(ЗЕЅАМЕ, "| выходная_команда_конвейера”) # организовать выходной фильтр 
ореп(ЅЕЅАМЕ, “входная_команда_конвейера |“) # организовать входной фильтр 


Однако рекомендуемая к использованию версия функции ореп, принимающая 
три аргумента, позволяет указать режим использования файла в отдельном аргу- 
менте. Это удобно, когда приходится иметь дело с именами файлов, которые не 
являются литералами и могут содержать символы, напоминающие символы ре- 
жима, или значимые пробелы. 


ореп(ЅЕЅАМЕ, "<" $ѕотеғі1е) # чтение существующего файла 

ореп(ЅЕЅАМЕ, “>, $ѕотеѓі1е) # создать файл и производить в него запись 
ореп(ЅЕЅАМЕ, ">>", $ѕотеғі1е) # дописывание в конец имеющегося файла 
ореп(ЅЕЅАМЕ, “|-”, “”выходная_команда_конвейера”) # организовать выходной фильтр 
ореп(ЅЕЅАМЕ, "|", ‘входная_команда_конвейера“”) # организовать входной фильтр 


Эта версия функции ореп также позволяет указать кодировку символов в файле, 
что мы и проделали в нашей программе-примере. 


ореп(3ЕЗАМЕ, "< : епсооіпо(ОТЕ-8)", $ѕопеғі1е) 
ореп(ЅЕЅАМЕ, "> :сг1Р”, фѕотеғі1е) 
ореп(ЅЕЅАМЕ, “>> :епсо41п9(МасКотап)”, $зоте*11е) 


Как можно видеть, имя для дескриптора файла выбирается произвольно. После 
открытия дескриптор файла $Е5АМЕ можно использовать для доступа к файлу или 
конвейеру, пока он не будет явным образом закрыт (с помощью, как можно дога- 
даться, с1озе(5ЕЗАМЕ)) либо пока дескриптор файла не будет связан с новым фай- 
лом посредством нового вызова ореп с тем же самым дескриптором в качестве пер- 
вого аргумента. Повторное открытие уже открытого дескриптора файла приводит 
к неявному закрытию первоначального файла, который становится недоступным 
дескриптору, и открытию нового файла. Необходимо проявлять осторожность — 
действительно ли это то, что вы собираетесь делать? Иногда это происходит слу- 
чайно, например, если вы сказали ореп($ћапо1е,$Ғі1е), а $ћапд1е содержит ту же 
строку, что и раньше. Следите, чтобы переменная $ћапӣ1е указывала на уникаль- 
ную строку, иначе будет открыт новый файл с прежним дескриптором. 


Но лучше оставить $папд1є неопределенной — Рег! самостоятельно выберет для нее 
значение. Этот прием может пригодиться, когда вы устанете выбирать имена для 
своих дескрипторов: если передать функции ореп переменную с неопределенным 
значением (например, созданную с помощью объявлениях пу), Ре! автоматически 
выберет строку для обозначения дескриптора файла и определит переменную: 


ореп(ту $һапд1е, "< :сг1Ғ :епсойіпд(ср1252)", $ѕотеҒі1е) 
|| 91е “невозможно открыть $ѕотеғі1е. $! , 
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Если вызов функции ореп увенчался успехом, переменная $ћапй1е определена, 
и ее можно использовать в качестве дескриптора файла. 


Открыв дескриптор файла для ввода, можно прочесть строку с помощью операто- 
ра чтения строки, <>. Его называют также оператором угловых скобок (ап ]е оре- 
гафюг). В оператор угловых скобок заключается имя дескрипторг. файла (<ЗЕЗАМЕ>, 
если речь идет о дескрипторе-литерале, или <$ћапд1е> в случае косвенного деск- 
риптора), строки которого требуется читать. Пустой оператор угловых скобок <> 
читает строки из всех файлов, указанных в командной строке, или из ЭТОТ№, если 
файлы не указаны. (Это стандартный режим для многих программ-фильтров.) 
Пример использования дескриптора файла ЗТОТК для чтения данных, вводимых 
пользователем, может выглядеть примерно так: 


рг1пт ЭТООУТ "Введите число: ‘ # запрос числа 
Ф$питрег = <5ТОТ№; # ввод числа 
ѕау ЅТрОШТ “Вы ввели число Фпитрег. \п”; # вывод числа 


Заметили, что мы только что вам подкинули? Чтс там делает 510007 в этих опера- 
торах ргіпі и ѕау? Это всего лишь один из способов использования дескриптора 
файла выходных данных. Дескриптор файла можно передавать между операто- 
ром и списком его аргументов, и если дескриптор указан, то определяет, куда 
должна быть направлени выдача. В данном случае указание дескриптора файла 
излишне, поскольку и без него выдача была бы направлена на ЗТООЦТ. Совсем как 
ЭТОГК устанавливается по умолчанию для ввода, 570007 устанавливается по умол- 
чанию для вывода. (В строке 22 нашего Примера вычисления среднего мы опус- 
тили дескриптор, чтобы не привести вас раньше времени в замешательство.) 


Запустив предыдущий пример, можно заметить, что выводится лишняя пустая 
строка. Это происходит потому, что операция чтения строки не удаляет автома- 
тически символ перевода строки из строки ввода (пользователь мог ввести, на- 
пример, “9\п”). Для тех случаев, когда нужно удалить символ перевода строки, 
в Рей есть функции спор и сһопр. Функция спор удаляет любой последний символ 
строки и возвращает его, в то время как сһопр удаляет только маркер конца заци- 
си (обычно `“\п") и возвращает число удаленных символов. Часто можно видеть 
такую идиому ввода отдельной строки: 


спопр($питбег = <5Т0ІМ№>), # ввести число и удалить перевод строки 
что равносильно следующему: 

$питрег = <5101№; # ввести число 

сһотр(Фпитрег); # удалить перевод строки 


И последнее замечание: не стоит считать значение переменной числом только по- 
тому, что она называется $пипбег. В ней может храниться любая строка. Ре! по- 
пытается интерпретировать ее как число, только если вы используете ее в чис- 
ленном выражении, а это – тема следующего раздела, посвященного операторам. 


Операторы 


Как мы намекали ранее, Ре] является и математическим языком. Это справедли- 
во на многих уровнях, начиная с низкоуровневых поразрядных логических опера- 
ций, включая операции над числами и множествами и далее, вплоть до более 
крупных предикатов и абстракций различного типа. А как известно из школьного 
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курса математики, математикам очень по душе необычные символы. Хуже того, 
специалисты по вычислительной технике придумали свои варианты этих стран- 
ных символов. В Ре! | тоже есть несколько таких странных символов, но, по правде 
сказать, в большинстве своем они непосредственно заимствованы из С, КОВТВАМ, 
ѕе(1) или ашЁ(1), поэтому пользователям этих языков они должны быть знакомы. 


Остальные могут утешиться тем, что изучение странных символов в Рег] может 
послужить началом изучения всех этих странных языков. 


Встроенные операторы Рей могут быть классифицированы по числу операндов 
как унарные (одноместные), бинарные (двухместные) и тернарные (трехместные) 
операторы. Их можно классифицировать по тому, являются ли они префиксными 
(предшествующими своим операндам) или инфиксными («разбавляющими» свои 
операнды). Можно также классифицировать их по типу объектов, с которыми они 
работают, например, с числами, строками, файлами. Далее мы приведем таблицу 
со всеми операторами, но для начала рассмотрим несколько полезных операторов. 


Некоторые бинарные арифметические операторы 


Арифметические операторы делают именно то, что можно подумать, если вы 
встречали их в школе. Они выполняют некоторые математические функции над 
числами (табл. 1.2). 


Тиблица 1.2. Математические операторы 


Название 


Результат 


фа + $0 Сложение Сумма $а и $6 
фа + $ Умножение Произведение $а и $6 
фа %№ $6 Взятие по модулю Остаток от деления $а на $6 


Возведение в степень $а в степени $0 
Да, мы опустили вычитание и деление — полагаем, что читатель сообразит, как 
они действуют. Поработайте с ними и проверьте, правы ли вы. (Или смошенни- 
чайте и посмотрите в главе 3.) Арифметические операторы выполняются в том по- 
рядке, который вам преподал школьный учитель математики (возведение в сте- 
пень раньше умножения; умножение раньше сложения). Для изменения очеред- 
ности всегда можно воспользоваться скобками. 


Строковые операторы 


Существует также оператор «сложения» для строк, осуществляющий конкатена- 
цию, т.е. соединяющий строки. В отличие от языков, в которых эта операция вы- 
глядит так же, как сложение чисел, в Регі для конкатенации строк определен от- 
дельный оператор (.): 


фа = 123; 

$6 = 456; 

зау Фа + $0; # выводит 579 
зау Фа . $6; # выводит 123456 


Есть также оператор «умножения» для строк, называемый оператором повторе 
ния (гереаі). Опять же, это самостоятельный оператор (х), отличный от оператора 
умножения чисел: 
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Фа = 123; 

$6 = 3; 

зау Фа * $0; # выводит 369 

зау $а х $6; # выводит 123123123 


Эти строковые операторы связывают значения с тем же приоритетом, что и соот- 
ветствующие им арифметические операторы. Оператор повторения несколько 
необычен тем, что принимает строку в качестве левого аргумента и число в каче- 
стве правого. Обратите также внимание, что Рег! автоматически преобразует чис- 
ла в строки. Все приведенные выше числа-литералы можно было бы заключить 
в кавычки, и результат от этого не изменился бы. Внутренне, однако, преобразо- 
вание производилось бы в обратном направлении, т.е. из строк в числа. 


Стоит обратить внимание еще на некоторые вещи. Конкатенация строк выполня- 
ется также при интерполяции, происходящей в строках, заключенных в двой- 
ные кавычки. И при выводе списка значений фактически производится конкате- 
нация строк. В результате три следующие команды дают одинаковый вывод: 


зау $а . “ равно ”. $6. “; # оператор “точка’ 
ѕау Фа, " равно “, $0, ".“, # список 
ѕау “Фа равно $6.”: й интерполяция 


Которую из них использовать в конкретной ситуации, зависит целиком от вас. 
(Однако мы считаем, что интерполяцию обычно легче всего читать.) 


Оператор х на первый взгляд кажется относительно бесполезным, но иногда он 
очень удобен, особенно для таких вещей: 


ѕау "-” х %5сгміа: 


В результате поперек экрана вычерчивается линия, если, конечно, $50гмій содер- 
жит число, соответствующее ширине экрана в символах, а не идентификатор 
винта (всгезм ійепіібіег). 


Операторы присваивания 


Хотя этот оператор является не совсем математическим, мы уже широко пользо- 
вались простым оператором присваивания =. Постарайтесь запомнить, что = озна- 
чает «устанавливается в значение», а не «равно». (Существует и математический 
оператор проверки равенства ==, который означает «равно», и если вы с самого на- 
чала усвоите разницу между ними, то убережетесь от возникновения проблем 
в будущем. Оператор == действует как функция, возвращающая логическое зна- 
чение, тогда как = больше похож на процедуру, которая выполняется для получе- 
ния побочного эффекта модификации переменной.) 


Как и операторы, описанные выше, операторы присваивания представляют со- 
бой бинарные инфиксные операторы; это значит, что их операнды расположены 


В настоящей книге, а также в документации Рег! авторы используют понятие «связы- 
вания» или «скрепления» (английский глагол Біпа) для образной передачи интерпре- 
тации языком приоритетов операторов. В сложных выражениях вроде $0 + $с » $0 опе- 
ратор * «связывает» значения переменных $с и $0 сильнее, чем оператор + связывает 
значения переменных $ и $с, поэтому умножение имеет больший приоритет и вычис- 
ляется перед сложением. В том же контексте могут использоваться словосочетания 
вроде «более сильное связывание». — Прим. науч. ред. 
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по обеим сторонам оператора. Правый операнд может быть произвольным выра- 
жением, но левый должен быть допустимым [ значением: ([уаае), что в переводе 
на обычный язык означает допустимую область памяти типа переменной или 
элемента массива. Чаще всего используется простой оператор присваивания. Он 
вычисляет значение выражения, находящегося в правой части, а затем устанав- 
ливает переменную в левой части равной этому значению: 


$а = $6; 
фа = $0 + 5; 
фа = $а * 3; 


Заметьте, что последнее присваивание дважды ссылается на одну и ту же пере- 
менную: один раз ири вычислении, и один раз при присваивании. В этом нет 
ошибки, но такая операция выполняется столь часто, что для нее существует со- 
кращенное обозначение (заимствованное из С). Операция вида: 


1-значение оператор= выражение 
выполняется так, как если бы было записано: 
1-значение = 1-значение оператор выражение 


за исключением того, что |-значение не вычисляется дважды. (Разница есть лишь, 
когда вычисление ]-значения имеет побочные эффекты. Но в тех случаях, когда 
разница есть, она обычно состоит именно в том, что вам требуется. Так что не сто- 
ит об этом волноваться.) 


Так, предыдущий пример можно было бы записать в следующем виде: 
фа *= 3; 
что следует читать как «умножить $а на 3». Такое сокращение допустимо в Регі 


почти для любого бинарного оператора, даже для некоторых операторов, с кото- 
рыми в С это нельзя делать: 


$111е .= "\п”: # Дописать символ перевода строки к $11пе 
$1111 х= 80; # Сделать строку $1111 80-кратным повторением самой себя. 
фуа1 ||= "2"; # Установить значение $уа1 равным 2, если оно не "+тџе ' 


В строке 10 нашего Примера вычисления среднего? есть две конкатенации строк, 
одна из которых представляет собой оператор присваивания. А строка 18 содер- 
жит сокращенный оператор +=. 


Независимо от того, какого типа оператор присваивания используется, в качест- 
ве значения присваивания в целом возвращается конечное значение переменной 
в левой части. Это не удивит программистов на С, которым известно, как исполь- 
зовать эту идиому для обнуления переменных: 


1 Термин 1уаше (от Іеёё уаще – левое значение) берет начало от оператора присваивания 
Е1 = Е2, где левый аргумент должен быть |-значением. – Прим. науч. ред. 


А вы думали, что мы про него забыли? 


з Это не так, как, скажем, в Раѕса1, где присваивание является оператором и не возвра- 
щает никакого значения. Мы уже говорили, что присваивание аналогично процедуре, 
но запомните, что в Рег даже процедуры возвращают значения. 
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фа = $6 = $ = 0, 


Также часто можно видеть, что присваивание используется в условии цикла 
ине, как в строке 8 нашего Примера вычисления среднего. 


А вот что должно удивить программистов на С, так это то, что присваивание 
в Рег! возвращает фактическую переменную в виде 1-значение, поэтому можно 
модифицировать одну и ту же переменную несколько раз в одном операторе. На- 
пример, можно написать: 


(Фетр == 32) к= 5/9. 


для преобразования по месту из шкалы Фаренгейта в шкалу Цельсия. Это еще 
одна причина, по которой ранее в этой главе мы могли сказать: 


сһотр (Фпитрег = <5Т0ІМ); 


чтобы «обрубить» конечное значение $пипбег. Вообще говоря, эту особенность 
можно использовать всякий раз, когда требуется что-то скопировать и одновре- 
менно произвести над этим значением какие-то действия. 


Унарные арифметические операторы 


Как если бы запись фуагіаб1е += 1 была недостаточно короткой, Рег! заимствует из 
С еще более лаконичный способ приращения переменной. Операторы инкремента 
и декремента просто увеличивают или уменьшают значение переменной на еди- 
ницу. Они могут помещаться с любой стороны от переменной, в зависимости от 
того, в какой момент требуется выполнить операцию (табл. 1.3). 


Таблица 1.3. Операторы инкремента 


Пример Название Результат 


++фа, $а++ 
--Фа, $а-- 


Инкремент Прибавить 1 к $а 


Декремент Вычесть 1 из $а 
Когда один из этих «автоматических» операторов предшествует переменной, это 
называется префиксным инкрементированием (декрементированием) перемен- 
ной, а значение переменной будет изменено перед тем, как произойдет обращение 
к ней. Когда оператор помещается после переменной, то это называется пост- 
фиксным инкрементированием (декрементированием) переменной, и ее значение 
изменяется после использования. Например: 


фа = 5; # Фа получает значение 5 
++фа; # $6 получает инкрементированное значение Фа, т.е. 6 
фа--; # $с присваивается 6, затем $а декрементируется и становится 5 


= => 
ог 
ии 


В строке 19 нашего Примера вычисления среднего число результатов увеличи- 
вается на единицу, и мы получаем количество результатов, которые нужно ус- 
реднить. При этом используется оператор постфиксного инкрементирования 
($ѕсогеѕ++), но в данном случае это несущественно, поскольку выражение приме- 
няется в пустом контексте, что представляет собой лишь причудливый способ 


58 Глава 1. Обзор Рей 


сказать, что выражение вычисляется только ради побочного эффекта инкремен- 
тирования переменной. Возвращаемое значение при этом отбрасывается.! 


Логические операторы 


Логические операторы, которые называют также операторами «короткого пути» 
(«ѕћһогі-сігсий»), позволяют программе принимать решения, исходя из нескольких 
критериев, без применения вложенных операторов 11. Их называют операторами 
короткого пути, поскольку они пропускают (закорачивают) вычисление правого 
аргумента, если считают, что в левом аргументе содержится достаточно информа- 
ции для получения итогового результата. Это делается не только для повышения 
производительности. Программист может явным образом использовать этот ре- 
жим закорачивания, чтобы избежать вычислений в правом аргументе, о которых. 
ему известно, что они сорвались бы, если бы их не «охранял» левый аргумент. 
В Ре! можно сказать: «СаШогтла ог Баз» (Калифорния или провал), и при этом 
не провалиться (предполагая, что вы действительно доберетесь до Калифорнии). 


На самом деле в Рег] есть два набора логических операторов: традиционный на- 
бор, заимствованный из С, и более новый (но еще более традиционный) набор опе- 
раторов со сверхнизким приоритетом, заимствованный из ВАЗС. Оба набора при 
надлежащем применении повышают удобочитаемость программ. Операторы С, 
использующие знаки пунктуации, уместны, когда желательно, чтобы логиче- 
ские операторы имели больший приоритет, чем запятые, тогда как записываемые 
словами операторы ВАЗТС хорошо использовать, когда желательно, чтобы запя- 
тые имели больший приоритет, чем логические операторы. Часто они, в конечном 
итоге, действуют одинаково, а использование того или иного набора является де- 
лом вкуса. (Примеры, выявляющие контраст, можно найти в разделе «Логиче- 
ские апа, ог, поё и хог» главы 3.) Хотя из-за различных приоритетов эти два набо- 
ра операторов не являются взаимозаменяемыми, после синтаксического анализа 
сами операторы ведут себя одинаково; приоритетность просто определяет область 
расположения их аргументов. В табл. 1.4 перечислены логические операторы. 


Таблица 1.4. Логические операторы 


Название 


фа && $6 $а, если $а ложно, в противном случае $0 


Фа || $6 $а, если Фа истинно, в противном случае $0 
і фа Истинно, если $а не истинно 

фа апа $6 $а, если Фа ложно, в противном случае $0 
$а ог $6 фа, если $а истинно, в противном случае $6 
поё $а Истинно, если $а не истинно 


$а хог $6 ИСКЛЮЧАЮЩЕЕ ИЛИ | Истинно, если $а или $0 истинны, но не обё сразу 


1 Оптимизатор обратит на это внимание и преобразует постфиксное инкрементирование 
в префиксное, поскольку последнее выполняется немного быстрее. (Вам необязатель- 
но знать об этом, но мы надеемся, что это вас ободрит.) 


Операторы 59 


Благодаря тому, что логические операторы «закорачивают» вычисление, их час- 
то используют в Ре! для условного выполнения кода. В следующей строке (стро- 
ка 4 нашего Стандартного примера) делается попытка открыть файл атгадез: 


ореп(СААрЕЅ, “<: 8”, “дгадез”) || діе "Невозможно открыть дгадез: $!\п” 


Если файл удается открыть, интерпретатор переходит к следующей строке про- 
граммы. Если файл открыть не удается, выводится сообщение об оптибке и вы- 
полнение прекращается. 


Буквально эта строка означает: «Открыть #га4ез или умереть!» Операторы корот- 
кого пути служат еще одним примером естественности языка, но, кроме того, со- 
храняют наглядность исходного текста. Важные действия перечисляются в левой 
части экрана, а второстепенные скрыты справа. (Переменная $! содержит сообще- 
ние об ошибке, полученное от операционной системы — см. главу 25.) Конечно, эти 
логические операторы можно использовать и в более традиционных условных вы- 
ражениях, таких как операторы 11 и мһћі1е. 


Некоторые операторы сравнения чисел и строк 


Операторы сравнения, или отношения, сообщают нам о том, как две скалярные 
величины (числа или строки) относятся одна к другой. Есть два набора операторов: 
один сравнивает числа, а другой – строки. (В любом случае аргументам будет сна- 
чала «принудительно» навязан соответствующий тип.) Взяв за левый и правый ар- 
гументы, соответственно $а и $0, получаем результаты, перечисленные в табл. 1.5. 


Таблица 1.5. Операторы сравнения 


Сравнение Числа | Строки | Возвращаемое значение 
Равно Истина, если $а равно $6 
Не равно Истина, если $а не равно $0 
Меньше Истина, если $а меньше $0 
Больше Истина, если $а больше $0 


Меньше или равно Истина, если $а не больше $6 


Болыше или равно Истина, если $а не меньше $0 


Сравнение 0, если $а и $6 равны, 1, если $а больше, -1, если $6 


больше 


Последние два оператора (<=> и стр) совершенно избыточны. Однако они крайне 
полезны в подпрограммах сортировки ѕогї (см. главу 27).1 


Кое-кто воспринимает такую избыточность как порочную, поскольку из-за нее язык 
перестает быть «минималистским», или ортогональным. Но Реп и не является ортого- 
нальным языком, это диагональный язык. Мы подразумеваем под этим, что Рег] не 
вынуждает программиста всегда перемещаться под прямым углом. Иногда хочется по- 
пасть в нужное место по гипотенузе треугольника. ТМТОУУТОГ предполагает возмож- 
ность срезать углы. Возможность срезать углы работает на эффективность. 
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Некоторые операторы проверки файлов 


Операторы этой группы позволяют проверить атрибуты файлов, чтобы работать 
с этими файлами не вслепую. Основным атрибутом файла является, конечно, факт 
его существования. Например, весьма уместно поинтересоваться, не существует 
ли уже у вас файл с почтовыми псевдонимами, прежде чем открывать его как но- 
вый файл, удаляя при этом все имеющиеся в нем данные. В табл. 1.6 перечислено 
несколько операторов проверки файлов: 


Таблица 1.6. Операторы проверки файлов 


Пример | Название Результат 


-е $а Существует (ехіѕіѕ) | Истина, если фаил с именем Фа существует 
—г $а Доступен для чте- | Истина, если файл с именем Фа доступен для чтения 
ния (геадае) 
-м Фа Доступен для запи- | Истина, если файл с именем $а доступен для записи 
си (угЦаЫе) 
—4 Фа Каталог (дігесіогу) | Истина. если файл с именем фа является каталогом 
-Г $а Файл (#1е) Истина, если файл с именем $а является обычным файлом 
Т $а Текстовый файл Истина, если файл с именем $а является текстовым фай- 


(ёехі Ше) лом 


Можно так использовать эти операторы: 


-е “/изг/б1п/рег1” ог магп "Рег1 неправильно установлен\п“; 
-Г "/мт1іпих" апа зау "Вижу, что вы друг Линуса”; 


Обратите внимание, что обычный (гесшаг) файл – не то же самое, что текстовый 
файл (бех Ее). Двоичные файлы типа /отйпиг являются обычными, но не тек- 
стовыми. Текстовые файлы представляют собой противоположность двоичным 
файлам, тогда как обычные файлы – противоположность «иррегулярным» фай- 
лам типа каталогов или устройств. 


Существует много операторов проверки файлов помимо перечисленных нами. 
Большинство таких операторов являются унарными логическими операторами, 
т.е. принимают только один операнд (скаляр, значением которого является имя 
файла или его дескриптор) и возвращают значение їе или #а15е. Некоторые из 
них возвращают более замысловатые значения, например, размер или время, от- 
носящееся к файлу; их, когда они вам понадобятся, вы сможете найти в разделе 
«Именованные унарные операторы и операторы проверки файлов» в главе 3. 


Управляющие конструкции 


До настоящего момента все рассмотренные нами примеры, за исключением одно- 
го большого примера, были совершенно прямолинейными: мы выполняли все ко- 
манды по порядку. Мы привели несколько примеров использования операторов 
короткого пути для выполнения (или невыполнения) отдельной команды. Хотя 
можно писать очень полезные линейные программы (к ним относятся многие сце- 
нарии ССІ), при наличии условных выражений и циклов можно создавать значи- 
тельно более мощные приложения. В совокупности эти механизмы называются 
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управляющими конструкциями. Поэтому можно рассматривать Рег! и как управ- 
ляющий язык. 


Но чтобы управлять, необходимо иметь возможность принимать решения, а что- 
бы принимать решения, нужно знать, в чем разница между истиной и ложью. 


Что есть истина? 


Мы обсуждали термин «истинность» ги)! и упоминали, что некоторые опера- 
торы возвращают значения {гие или Ѓа15е. Прежде чем двигаться дальше, необхо- 
димо точно договориться, что под ними подразумевается. В Рег] значение истин- 
ности рассматривается несколько иначе, чем в других языках программирова- 
ния, но, поработав с ним некоторое время, читатель найдет это очень разумным. 
(На самом деле, мы надеемся, что разумным это покажется вам после чтения ни- 
жеизложенного.) 


В сущности, Ре] считает, что истина самоочевидна. Это поверхностный способ 
сказать, что можно оценить истинность почти чего угодно. В Рей используется 
практическое определение истинности, зависящее от типа того, что подвергается 
оценке. Оказывается при этом, что типов истинности существует значительно 
больше, чем типов неистинности. 


Истинность в Ре! всегда вычисляется в скалярном контексте. Какого-либо дру- 
гого приведения типов не производится. Вот правила для различных типов зна- 
чений, которые может содержать скаляр: 


1. Любая строка, кроме "и "0", является истиной. 

2. Любое число, кроме 0, является истиной. 

3. Любая ссылка является истиной. 

4. Любая неопределенная величина является ложью. 


Фактически последние два правила следуют из двух первых. Любая ссылка (пра- 
вило 3) указывает на нечто, имеющее адрес, и имеет значением число или строку, 
содержащую этот адрес, который не может быть равен 0, поскольку всегда опре- 
делен. А всякая неопределенная величина (правило 4) всегда имеет значением 0 
или пустую строку. 

А внекотором смысле и правило 2 можно вывести из правила 1, если представить, 
что все величины являются строками. Опять же, для вычисления истинности 
никакого приведения строк не производится, но если бы приведение строк произ- 
водилось, число 0 превратилось бы в строку "0" и оказалось бы ложью. Любое дру- 
гое число превратилось бы в строку, отличную от "0", а потому оказалось бы исти- 
ной. Рассмотрим несколько примеров, которые позволят лучше это понять: 


0 # становится строкой “0”, поэтому Ға15е 
1 # становится строкой `1”, поэтому гие. 
10 - 10 # 10 минус 10 равно 0, преобразуется в строку “С”, поэтому Га1зе. 
0.00 # равно 0, преобразуется в строку “0°, поэтому Ёа1$е. 
70" # является строкой "0", поэтому Ра15е 
й # является пустой строкой, поэтому ?а15е. 
0.00" # является строкой "0 00°, ни “”, ни "0", поэтому їгие! 
0.00“ + 0 # становится числом 0 (приведение из-за +), поэтому Та1зе. 


1 Строго говоря, это не истина. 
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\$а # является ссылкой на Фа, поэтому Егие, даже если Фа есть Ға1ѕе 
опдеѓ() # функция, возвращающая неопределенное значение, поэтому та1ѕе. 


Поскольку ранее было что-то невнятно сказано о вычислении истинности в ска: 
лярном контексте, у читателя может возникнуть вопрос о том, как оценивается 
истинность списка. Отвечаем: ни одна операция Рег] не возвращает список в ска- 
лярном контексте. Обнаружив скалярный контекст, все они возвращают скаляр- 
ное значение, для которого уже применяются правила истинности. Поэтому здесь 
не возникает проблемы, ведь можно определить значение, возвращаемое любым 
таким оператором в скалярном контексте. Оказывается, как массивы, так и хе- 
ши возвращают скалярные значения, являющиеся истиной, если в массиве или 
хеше есть хоть один элемент. Подробнее об этом далее. 


Операторы Й и ипіеѕѕ 


Мы видели выше, что логический оператор может действовать в качестве услов- 
ного. Несколько более сложной формой логического оператора является оператор 
17. Оператор 1! вычисляет истинность условия (т.е. логическое выражение) и вы- 
полняет блок кода, если условие истинно: 


1+Е ($0ебид_ 1еуе1 > 0) { 
# Что-то не так. Сообщить пользователю. 
зау “Отладка: Тревога, Уилл Робинсон, тревога!”, 
ѕау "Отладка: Ответ был ‘54°, а ожидалось '42' ": 


} 


Блоком называется один или несколько операторов, заключенных в пару фигур- 
ных скобок. Поскольку оператор ії выполняет блок, фигурные скобки требуются 
в нем по определению. Те, кто знаком с языком типа С, заметят отличие. Скобки 
необязательны в С, если команда в блоке всего одна, но в Ре! скобки нужны всегда. 


Бывает, что недостаточно выполнить блок команд, если условие истинно. Может 
потребоваться выполнить другой блок, когда условие ложно. Конечно, можно ис- 
пользовать два оператора 1! таких, что условие второго будет отрицанием усло- 
вия первого, но Регі предоставляет более элегантное решение. За блоком 17 может 
следовать необязательное второе условие, называемое =_5е, которое выполняется, 
только если условие 11 ложно. (Ветеранов программирования это не удивит.) 


Иногда возможных вариантов оказывается больше двух. В таких случаях требу- 
ется добавить условие истинности е151{ для каждого возможного варианта. (Вете- 
ранов программирования может весьма удивить орфография ключевого слова 
е1$1Р, но за нее мы не собираемся просить прощения. Извините.) 


11 ($сі+у ед “№ м Уогк”) { 
вау "Нью-Йорк находится к северо-востоку от Вашингтона, округ Колумбия. , 
} 
е151Ғ ($сіїу ед "Сһісадо") { 
ѕау “Чикаго находится к северо-западу от Вашингтона, округ Колумбия. "; 
} 
е151Ғ ($сіту ед "“Міаті") { 
ѕау "Майами находится к югу от Вашин-тона. И там гораздо теплее: “; 
} 
е1ѕе { 
ѕау "Извините, но я не знаю, где находится $сіїу. "; 
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Предложения іѓ и 6151? вычисляются по очереди, пока одно из них не окажется 
истинным или не будет достигнуто условие е15е. Когда одно из условий оказыва- 
ется истинным, выполняется его блок, а все остальные ветви пропускаются. Ино- 
гда требуется, чтобы никакие действия не выполнялись, если условие истинно — 
только если оно ложно. Применение пустого 11 с е15е выглядит неряшливо, а іі 
с отрицанием затруднять чтения кода; в обычном языке фраза «если не это явля- 
ется истиной, сделать то-то и то-то» звучит несколько странно. В таких случаях 
следует предпочесть оператор ип1е551: 


ип1езз ($оеѕїіпатіоп ес $һоте) { 
ѕау “Я еду не домой. `; 
} 


Оператор е150п1е55 отсутствует. Обычно это засчитывается как функция языка. 


Операторы дімеп и мһеп 


Чтобы обеспечить возможность сравнения единственного значения с множеством 
альтернатив, в последних версиях Ре’ появились инструкции, которые в других 
языках программирования обычно называются змс! и саѕе. Однако нам нравит- 
ся, когда Рег действует подобно естественному языку, так что мы назвали их 
діуеп и мпеп. (Так как вы уже добавили в начало программы директиву изе \5.14, 
эта функциональность, появившаяся в версии 5.10, должна быть доступна.) 


#1 /иѕг/ріп/рег1 
ибе %5. 14: 


рг1пї “Ваш любимый цвет? ", 
сһотр(ту Фапѕмег = <5Т01№>); 


дімеп (Фапѕмег) { 
мһеп (“фиолетовый”) { ѕау “Мой тоже." } 
мпеп (“зеленый”) { зау “Вперед!” } 
мһеп (“желтый”) { ѕау “Внимание!” } 
мһеп (“красный”) { зау "Стой!" } 


мћеп ("синий") { ѕау "Продолжайте." } 
мпеп (/\м+, нет \м+/) { 91е “ХРЯСЬ! "} 


мћеп (42) { ѕау "Неправильный ответ 


мһеп ([‘серый`, ‘оранжевый , коричневый’ черный’ белый ]) { 
зау "Я думаю, что Фапзмег тоже неплохо. 


} 


деғаџ1ї { 
ѕау “Вы уверены, что Фапзмег - это цвет?”; 


} 


Сначала инструкция дімеп вычисляет значение своего выражения и объявляет его 
темой беседы, благодаря чему последующие инструкции \Пеп знают, какое значе- 
ние сверять. Затем выполняется сопоставление аргументов каждой инструкции 


! «Если не», англ. – Прим. ред. 
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мпеп, чтобы отыскать первую инструкцию мһеп, значением которой соответствует 
теме. Сопоставление аргументов инструкций иПеп выполняется по порядку, свер- 
ху вниз, и прекращается, как только будет найдено первое соответствие — сопос 
тавление с остальными инструкциями мћеп не производится, а управление пере- 
дается сразу за пределы конструкции 01\ег.. 


Форма аргумента каждой инструкции мпеп ("красный" или 42 или /\м+, нет \м+/) 
определяет тип выполняемого сопоставления. Проще говоря, строки сопоставля- 
ются как строки, числа – как числа, а шаблоны - ну... как шаблоны. При сопос- 
тавлении со списками соответствие считается состоявшимся, если совпадает хо- 
тя бы одно значение. Инструкции мћеп внутренне выполняют операцию, получив- 
шую название «интеллектуальное сопоставление» (ѕтагіпаёсһіпе)!. Она выпол- 
няет сопоставление ожидаемым способом, за исключением случаев, когда решает, 
что нужен иной способ. Подробнее об этом рассказывается в разделе «Оператор 
интеллектуального сопоставления» в главе 3. 


Итеративные (циклические) конструкции 


Эти операторы позволяют программе Рен повторять выполнение одного и того же 
кода, за что и получили название итеративные (циклические) конструкции. Суще- 
ствует несколько типов таких конструкций, отличающихся в основном способом 
определения момента, когда следует выйти из цикла и заняться другими делами. 


Циклы с условием 


Операторы ип! 1е и ипїі1 ведут себя аналогично операторам 11 и ип1е55, но позволя- 
ют выполнять блок многократно, пока условие соблюдается. Условие всегда про- 
веряется перед началом очередной итерации. Если условие соблюдено (принимает 
значение {гие для мћі1е или Га15е для ипїі1), выполняется блок операторов цикла. 


ргіпі "Сколько билетов уже продано? 
пу $реғоге = <5Т0ІМ№; 


ту $5019 = $6еРоге; 
мп1]е ($3019 < 10000) { 
ту Фауа11а61е = 10000 - %501а; 
рг1п+ “$амаііаб1е билетов в наличии. Сколько нужно вам: 
ту Фригсвазе = <5Т0ІМ; 
1 (Фригспазе > Фама11абе) { 
зау "Слишком много! Попробуйте еще раз. ”; 
фригсһаѕе = 0; 
} 
$5010 += $ригсһаѕе; 


} 
зау “Билеты закончились, приходите в ругой раз.“; 


Обратите внимание, что если исходное условие не выполнено, вход в цикл вообще 
не производится. Например, если уже продано 10 000 билетов. программа сразу 
же сообщит, что все билеты проданы. 


1 Иногда оператор интеллектуального сопоставления, о котором пойдет речь в главе 3, 
называют еще оператором нечеткого сопоставления. – Прим. реб. 
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В строке 8 нашего примера вычисления среднего осуществляется чтение: 
мһі1е (ту $1іпе = <СВАрЕЅ>) { 


В результате очередная строка присваивается переменной $11пе и, как объясня- 
лось выше, возвращается значение $1іпе, поэтому в условии оператора мћі1е мо- 
жет быть определена истинность $1іпе. Читателю может показаться, что Рег! по- 
лучит ошибочное ложное значение при вводе пустой строки и досрочно выйдет из 
цикла. На самом деле этого һе произойдет. Причина будет понятна, если пораз- 
мыслить обо всем сказанном выше. Оператор чтения строки оставляет в конце 
строки символ перевода строки, поэтому пустая строка имеет значение "\п". А как 
известно, “\п” не является каким-либо из канонических ложных значений. По- 
этому условие истинно и цикл продолжается даже при вводе пустых строк. 


С другой стороны, когда в конце концов будет достигнут конец файла, оператор 
чтения строки вернет неопределенное значение, которое всегда ложно. В резуль- 
тате выполнение цикла прекращается там, где это нам и нужно. В Ре! не требу- 
ется явно проверять значение функции е0+, поскольку операторы чтения ввода 
разработаны так, чтобы гладко работать в контексте условных операторов. 


На практике почти все спроектировано так, чтобы гладко работать в условном 
(логическом) контексте. Если обратиться к массиву в скалярном контексте, воз- 
вращается размер массива. Поэтому часто встречается такая обработка аргумен- 
тов командной строки: 


мһі1е (@АВСУ) { 
ргосеѕѕ(ѕһіғі @АВСУ), 
} 


Оператор $1111 при каждой итерации цикла удаляет один элемент из списка аргу- 
ментов (и возвращает его). Цикл автоматически завершается, когда исчерпывает- 
ся массив @АНСУ, т.е. его длина становится равной 0. А 0 в Рег! является ложью. 
В некотором смысле сам массив становится ложью.! 


Трехчастный цикл 


Другой итеративный оператор — трехчастный цикл, также известный, как цикл 
Тог в стиле С. Трехчастный цикл выполняется точно так же, как цикл "пе, но 
выглядит совсем иначе из-за того, что в определение цикла было добавлено две 
дополнительные инструкции. (Однако программистам на С он покажется очень 
знакомым.) 


ри1пЕ “ Сколько билетов уже продано? 
пу Ф$бегоге = <5Т0ІМ>, 


Гог (ту $5010 = $реғоге; $010 < 10000; $501а += ту $ригсһаѕе) { 
пу Фамаі1аб1е = 10000 - $3019; 
ргіпї “Фауаі1ар1е билетов в наличии. Сколько нужно вам 


Это стиль мышления программистов на Рег|. Поэтому не нужно сравнивать 0 и 0, что- 
бы проверить, не является ли значением этого выражения «ложь». Несмотря на то что 
в других языках это требуется, не вступайте на путь выполнения явных сравнений ти- 
па мћі1е (@АНС\У != 0). Это неэффективно как для вас, так и для компьютера. Да и для 
каждого, кому придется сопровождать ваш код. 
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$ригсһаѕе = <5Т01№; 

11 ($ригсһаѕе > $аҹаі1аб1е) { 
ѕау “Слишком много! Попробуйте еще раз“; 
фригсһаѕе = 0; 


зау “ Билеты закончились, приходите в ругой раз. “; 


Трехчастный цикл принимает три выражения (откуда и взялось такое название), 
заключенных в круглые скобки и разделенных символом точка с запятой. Первое 
выражение выполняет начальную установку переменной цикла. Второе — усло- 
вие для проверки переменной цикла – действует так же, как в цикле м! Пе. И тре- 
тье выражение изменяет состояние переменной цикла – это выражение выполня- 
ется в конце каждой итерапии, подобно явной инструкции в конце цикла мћі1е 
в примере выше. 


Вначале цикла устанавливается исходное значение и проверяется истинность ус- 
ловия. Если условие истинно, выполняется блок. Когда блок кончается, выпол- 
няется модифицирующее выражение, снова проверяется истинность условия, и, 
если условие выполнено, блок выполняется снова с измененным значением управ- 
ляющей переменной. Пока условие сохраняет истинность, будут выполняться 
и блок, и модифицирующее выражение. (Обратите внимание, что только среднее 
выражение вычисляется с целью получения его значения. Первое и третье выра- 
жения вычисляются только ради получения побочного эффекта, а их значения 
отбрасываются!) 


Любое из трех выражений можно опустить, но двє точки с запятой должны при- 
сутствовать всегда. Если опустить выражение в середине, получится бесконеч- 
ный цикл, т.е. бесконечный цикл можно записать так: 


Рог (;;) { 
ѕау “Вынеси мусор!” 
51еер(5); 

} 


Цикл #огеасћ 


Последним из итеративных операторов Рег является цикл /огеасй,! применяе- 
мый для выполнения одного и того же кода для каждого скаляра из некоторого 
набора, которым может, например, быть массив: 


Гог ту Физег (@изегз) { 
ТЕ (-# "$поте{Физег}/.пехгс”) { 
уау “физег крут . он использует уі с поддержкой рег1!“ 


} 


1 Исторически он записывался с помощью ключевого слова Тогеасп, откуда и взялось на- 
звание цикла. В настоящее время предпочтение отдается ключевому слову Тог, посколь- 
ку такая инструкция читается более естественно, когда включается объявление ту, и не 
дает спутать синтаксис этого цикла с трехчастным циклом. Поэтому многие из нас 
больше не используют ключевое слово Гогеаси, хотя вы можете продолжать пользовать- 
ся им, если оно вам нравится. 
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В отличие от операторов і? и "пе, которые обеспечивают скалярный контекст 
в условном выражении, цикл /югеасй обеспечивает списочный контекст для вы- 
ражения в круглых скобках. Поэтому в результате вычисления выражения полу- 
чается список (не скаляр, даже если в списке лишь один скаляр). После этого пе- 
ременная цикла поочередно получает имена всех элементов списка, и блок кода 
выполняется по одному разу для каждого элемента списка. Обратите внимание, 
что переменная цикла ссылается на сам элемент, а не на его копию. В результате 
изменение переменной цикла приводит к изменению исходного массива. 


В типичной программе на Рег! можно обнаружить значительно больше циклов 
[огеасй, чем трехчастных циклов Гог, поскольку в Ре! очень легко создавать та- 
кие списки, которые требуются циклу ѓоғгеасћ для выполнения итераций. (Отчас- 
ти именно поэтому мы используем ключевое слово Гог — мы ленивы и считаем, что 
часто используемые слова должны быть как можно короче.) Вы часто будете 
встречать идиому перебора отсортированных ключей хеша в цикле: 


Тог ту $Кеу (ѕогі Кеуз %пазН) { 


На практике именно это делает строка 13 нашего Примера вычисления среднего, 
благодаря которой список студентов выводится в алфавитном порядке. 


Выход из цикла: пехї и [а$* 


Операторы пехї и 1аѕї позволяют изменять порядок выполнения команд в цикле. 
Не так уж редки особые ситуации, которые нужно пропускать или при возникно- 
вении которых нужно завершить цикл. Например, при работе с учетными запи- 
сями в ОМГХ может потребоваться пропустить системные учетные записи, такие 
как гооё или р. Оператор пехї позволяет перейти в конец текущей итерации цик- 
ла и начать новую итерацию. Оператор 1а5ї позволяет перескочить конечную гра- 
ницу блока, как если бы условие выполнения цикла вдруг оказалось ложным. 
Это может быть полезно, если требуется, к примеру, отыскать определенную учет- 
ную запись и, найдя ее, выйти из цикла. 


Рог ту Физег (@изегз) { 

11 ($иѕег ед "гоо" || Физег ед “1р") { 
пех+, 

} 

1? ($иѕег ед “ѕресіа1") { 
ргіпЕ “Найдена учетная запись ѕресіа1.\п"; 
# какая-то обработка 
1Іавї; 


} 


Существует возможность прерывать выполнение вложенных циклов с помощью 
меток циклов, позволяющих поименно указывать циклы для выхода. При ис- 
пользовании модификаторов операторов (другого вида условных операторов, о ко- 
тором речь пойдет ниже) это позволяет создавать исключительно понятные конст- 
рукции выхода из циклов (если вы согласны, что английский язык – понятный): 


УМЕ: мһћі1е (ту $1іпе = <ЕМАТЬ>) { 
пех ІЛІМЕ 1 $1іпе =- “\п”; # пропустить пустые строки 
Іаѕі ІІМЕ 11 $11те =- /7>/; # остановиться на первой строке в кавычках 
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# здесь могла бы быть ваша реклама 


} 


Читатель может сказать: «Погодите, что это еще за нелепые значки ^> между по- 
косившимися зубочистками? Это не очень-то похоже на английский язык.» И бу- 
дет прав. Это шаблон для поиска, содержащий регулярное выражение (хотя и до- 
вольно простое). О регулярных выражениях будет рассказано в следующем раз- 
деле. Рег] является лучшим в мире языком обработки текста, а регулярные выра- 
жения — основной механизм обработки текста в Рег]. 


Регулярные выражения 


Регулярные выражения (гевиіаг ехргеѕзіопѕ) (известные также как гебехез, герехрѕ 
или ВЕ) используются многими программами поиска, такими как &гер и йпа$т', 
пакетными редакторами текста вроде зе4 и аш, а также редакторами — напри- 
мер, оі и етасз. Регулярное выражение — это способ описать множество строк, не 
перечисляя все строки, входящие в это множество! Регулярные выражения вхо- 
дят во многие другие языки программирования (некоторые из них даже рекла- 
мируются как поддерживающие «регулярные выражения Ре 5»!), но ни р один 
из этих языков регулярные выражения не интегрированы так, как в Реп. Регу- 
лярные выражения используются в Ре! несколькими способами. Во-первых, 
и это главное, они применяются в условных операторах, чтобы определить, соот- 
ветствует ли строка некоторому шаблону, поскольку в логическом контексте они 
возвращают «истину» или «ложь». Поэтому, увидев в условном операторе нечто 
вроде /Гоо/, знайте, что перед вами обычный оператор сопоставления с шаблоном 
(раќегп-таёсһіпе орегаёог): 


1Е (/іпдомѕ 7/) { ргіпї “Пора делать апгрейд? \л” } 


Во-вторых, найдя в строке соответствие шаблону, можно заменить его чем-то дру- 
гим. Поэтому, увидев нечто типа $5/ѓоо/баг/, знайте, что это задание Рег] подста- 
вить при возможности «Баг» вместо +00». Мы называем это оператором подста- 
новки (виђѕйёиіоп). Он также возвращает 1гуе или ѓа15е в зависимости от успеш- 
ности операции, но обычно выполняется ради своего побочногс эффекта: 


5/1ВМ/1епоуо/; 


Наконец, с помощью шаблонов можно определять не только факт существования, 
но и факт отсутствия. Так, оператор 5р11ї использует регулярное выражение, 
чтобы определять, где данных нет. Это значит, что регулярное выражение задает 
разделители (зерага1огз), разграничивающие поля данных. В нашем Примере вы- 
числения среднего есть пара простейших образцов. В строках 9 и 16 производится 
расщепление строк по пробелам и возвращается список слов. Но расщепление воз- 
можно и по любому другому разделителю, заданному регулярным выражением: 


пу ($9009, $Бад, %$и91у) = 5р11+(/,/, "уі, етасѕ, тесо”), 


1 Хорошим источником информации по концепциям регулярных выражений служит 
книга Джеффри Фридла (ЗеЁгеу Егіед!) «Маѕіегіпе Верцаг Ехргеѕѕіопѕ» («Регуляр- 
ные выражения», 8-е издание, Символ-Плюс, 2008). 
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(Существуют различные модификаторы, которые можно применять в каждом из 
этих случаев для осуществления экзотических действий. К примеру, можно 
предписать Регі не обращать внимания на регистр при поиске символов алфави- 
та, но эти кровавые подробности мы будем освещать во второй части книги, когда 
доберемся до кровавых подробностей.) 


В простейшем случае регулярные выражения используются для поиска лите- 
рального выражения. В приведенном выше примере расщепления осуществлялся 
поиск одиночных запятых. Но если надо отыскать несколько символов подряд, то 
и в строке они должны идти один за другим. То есть шаблон, как можно догадать- 
ся, ищет подстроку. Допустим, что требуется показать все строки файла НТМТ,, 
содержащие ссылки НТТР (но не ссылки ЕТР). Представим себе, что мы ьпервые 
работаем с файлом НТМУ, и слегка наивны. Мы знаем, что в этих ссылках всегда 
где-то присутствует "Нт{р:". Можно организовать такой цикл по нашему файлу: 


мһі1е (ту $1іпе = <ЕШЕ>) { 
ЇР ($1іпе =- /ВЕЕр:/) { 
ргіп $11іпе; 


} 


Здесь =- (оператор привязки шаблона) указывает Рей на необходимость поиска со- 
ответствий регулярному выражению "һіїр:” в значении переменной $1іпе. Если со- 
ответствие найдется, оператор вернет значение «истина» и будет выполнек блок 
(оператор ргіпі).^ 

Между прочим, если не использовать оператор привязки =-, то Рег] будет осуще- 
ствлять поиск в строке, установленной по умолчанию, а нев $1іпе. Это все равно, 
что сказать: «Ой! Помогите найти мою контактную линзу!» И люди станут авто- 
матически искать ее около вас, хотя вы не говорили им, где нужно искать. Рег] 
тоже знает, что есть место поиска по умолчанию, если не указано, где надо ис- 
кать. Эта строка по умолчанию является на самом деле особой скалярной пере- 
менной с необычным именем $_. На практике это место по умолчанию использу- 
ется не только для поиска по шаблону; многие операторы Рей используют по 
умолчанию переменную $_, поэтому опытный программист на Ре!|, вероятно, за- 
писал бы последний пример так: 


мһі1Іе (<ЕТШЕ>) { 
ргіпі і? /ВЕЕр:/ 
} 


(Хм-м, похоже, что сюда проник еще один из этих модификаторов операторов. 
Хитрые маленькие бестии.) 


Все это достаточно удобно, но что если нужно найти все типы ссылок, а не только 
ссылки НТТР? Можно дать список типов ссылок, например, `Піїр:", "#ір:", "та {о 
и т.д. Но этот список может оказаться длинным, да и как быть, если появится но- 
вый тип ссылок? 


мһ11е (<ЕТІЕ>) { 
ргіпі і? /ҺЕТр:/; 
ргіпі і? /ҒЕр:/; 


1 Это очень похоже на то, что делает команда ОМІХ огер ‘пр: Ее. 
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ргіпї і? /таі110:/; 
# Что еще? 


} 


Поскольку регулярное выражение описывает множество строк, можно просто 
описать, что мы ищем: несколько символов алфавита, за которыми следует двое- 
точие. На языке регулярных выражений (регулярском?) это будет выглядеть как 
Ла-2А-7]+:/, где квадратные скобки определяют класс символов (сһагасіег с]аѕѕ). 
Групны 2-7 и А-7 представляют все символы английского алфавита (дефис обозна- 
чает диапазон всех символов с начального по конечный включительно). А знак + 
является специальным символом, означающим «не менее одного из того, что мне 
предшествовало». Это то, что мы называем квантификатором (диапийег), пред- 
ставляющим собой штуковину, позволяющую сообщить, сколько раз нечто мо 
жет повториться. (Символ косой черты не является частью регулярного выраже- 
ния, это часть оператора сопоставления с шаблоном. Пара таких косых черт дей- 
ствует подобно кавычкам, в которые заключается регулярное выражение.) 


Поскольку некоторые классы, например, символы алфавита, используются очень 
часто, Рег определяет для них сокращения, перечисленные в табл. 1.7. 


Таблица 1.7. Сокращения. представляющие алфавитные символы 


Название 


Определение в АЗСП | Определение в Юникоде 
Пробельный символ | [ \ї\п\г\#] 
[а-2А-2_0-9] 


[0-9] 


\$ 
[\рќА1рһабетіс}\р{0191ї}\ріМагк}\ріРс}] | \м 
\р{0191} 


\р{инТезрасе} 


Символ слова 


Цифра 


Заметьте, что эти коды соответствуют одиночным символам. Метасимвол \н ищет 
соответствие любому одиночному символу слова, а не целому слову. (Квантифи- 
катор + еще не забыт? Можно задать \и+ для поиска целого слова.) В Рей можно 
задать отрицание этих классов, используя символы верхнего регистра: напри- 
мер, \0 означает символ, не являющийся цифрой. 


Следует заметить, что \м не всегда эквивалентно [а-2А-7_0-9] (а \0 не всегда эквива- 
лентно [0-9]). В некоторых наборах параметров локализации (]оса]ез) определяют- 
ся дополнительные символы, не входящие в АСП, и метасимвол \ в курсе таких 
дополнений. Новым версиям Рег| (выше 5.8.1) «знакомы» также свойства букв 
и цифр Юникода, и символы Юникода с этими свойствами обрабатываются над- 
лежащим образом. (Рей даже идеограммы и объединяющие символы рассматри- 
вает как символы \м.) 


Есть еще один совершенно особенный класс символов, записываемый как точка 
(.), которому соответствует вообще любой символ.! Например, /а./ соответствует 
любой строке, содержащей а, если только это не последний символ в строке. Та- 
ким образом, это выражение соответствует аї или ап, или даже а!, но не а, по- 
скольку после а нет ничего, чему могла бы соответствовать точка. Поскольку по- 
иск по шаблону выполняется в любом месте строки, ему соответствуют также 
оаѕіѕ и саме], но не ѕћеба. Он соответствует первому символу а в слове сагауап. Он 


1 За исключением того, что обычно символ перевода строки ему не соответствует. Можно 


вспомнить, что (.) обычно не соответствует переводу строки и в &гер(1). 
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мог бы соответствовать и второму символу а, но поиск (ведущийся слева направо) 
останавливается после нахождения первого соответствия. 


Квантификаторы 


Символы и классы символов, о которых мы говорили, ищут соответствие одиноч- 
ным символам. Мы уже говорили, что можно искать соответствие нескольким 
символам «слова» посредством \м+. Одним из квантификаторов является +, но есть 
и другие. Любой квантификатор следует за элементом, количество вхождений ко- 
торого определяет. 


В самом общем виде квантификатор задает минимальное и максимальное допус- 
тимое число соответствий элемента. Эти два числа заключаются в скобки и раз- 
деляются запятой. Например, если пытаться найти номера телефонов в Северной 
Америке, то последовательность \0{7,11) соответствует не менее чем семи цифрам, 
но не более чем одиннадцати. Если в скобки помещено одно число, оно задает од- 
новременно минимум и максимум, т.е. точное числс соответствий элемента. (Все 
элементы без указания количества имеют неявный квантификатор {1}.) 


Если указать минимум и запятую, но опустить максимум, то максимум прини- 
мается равным бесконечности. Иными словами, соответствие должно быть най- 
дено хотя бы минимальное число раз, плюс еще сколько угодно. Например, \0{7} 
будет соответствовать только первым семи цифрам (к примеру, местному номеру 
в Северной Америке или первым семи цифрам более длинного номера), в то время 
как \@{7,} будет соответствовать любому номеру телефона, даже международному 
(если только он не окажется короче семи цифр). Нет специального способа зада- 
ния «не более чем» определенного числа раз. Нужно просто сказать, например, 
{0,5}, чтобы найти не более пяти произвольных символов. 


Некоторые сочетания минимума и максимума встречаются так часто, что в Рег] 
для них имеются особые квантификаторы. Мы уже видели +, означающий то же, 
чтго {1, }, или «хотя бы один из предшествующих элементов». Имеется также +, что 
равносильно {0,}, или «ноль или более предшествующих элементов», а также 7, 
что равносильно {0,1}, или «ноль или один предшествующий элемент» (иначе го- 
воря, предшествующий элемент является необязательным). 


Применяя квантификаторы, следует кое в чем проявлять осторожность. Во-пер- 
вых, квантификаторы Ре! по умолчанию являются жадными. Это означает, что 
они ищут самое длинное соответствие шаблону из всех возможных. Например, 
если искать /\4+/ в строке 1234567890, то будет найдена вся строка. За этим нужно 
следить, особенно если используется символ ‚соответствующий любому симво- 
лу. Часто встречаются ситуации, когда в строке типа 


1аггу: ЈҮНЕРҺО. /МТУ: 100:10:[аггу Ма11: /һоте/1аггу: /о1п/Есѕһ 


выполняется поиск 1аггу: с помощью / +:/. Однако, поскольку квантификатор + 
является жадным, соответствие шаблону включит все до конца подстроки /поте/ 
Іаггу:, поскольку отыскивается самое длинное соответствие перед последним 
двоеточием, включая другие двоеточия. Иногда этого удается избежать посредст- 
вом отрицания класса, т.е. с помощью выражения /[7:]+:/, которое требует найти 
один или несколько символов (как можно больше), не являющихся двоеточием, 
вплоть до первого двоеточия. Эта маленькая «крышечка» в регулярном выраже- 
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нии служит для отрицания класса символов.! Другой момент, который надо иметь 
в виду, — это стремление регулярных выражений находить как можно более ран- 
нее соответствие. Оно даже берет верх над жадностью. Поскольку просмотр стро- 
ки происходит слева направо, это означает, что соответствие шаблону будет най- 
дено как можно левее, даже если в другом месте есть более длинное соответствие. 
(Регулярные выражения жадны, но вознаграждение предпочитают получать как 
можно быстрее.) Предположим, например, что используется команда подстанов- 
ки (5///) в строке по умолчанию, т.е. в отношении переменной $_, и требуется уда- 
лить последовательность символов х из середины строки. Если сказать: 


$ = "Ёгед ххххххх Багпеу”; 


5/х*//; 


эффекта не будет никакого! Это связано с тем, что х» (означающее ноль или более 
символов х) соответствует «ничему» в начале строки, поскольку пустая строка 
имеет длину ноль символов, а ясно, как божий день, что перед символом ѓ в слове 
Ёгед сидит пустая строка.? И еще об одной вещи нужно знать. По умолчанию кван- 
тификаторы применяются к единственному предшествующему символу, поэтому 
/бап{2}/ найдет рапп, но не бапрап. Чтобы применить квантификатор к нескольким 
символам, поставьте скобки. Для поиска рапрат используйте шаблон /(Бапт){2}/. 


Минимальное соответствие 


При работе с доисторическими версиями Рег], когда не нужен был жадный поиск, 
приходилось использовать отрицание класса. (На самом деле все равно получал- 
ся жадный поиск, но несколько более сдержанный.) 


В новых версиях Рей можно принудительно задать нежадный, минимальный по- 
иск, поместив после любого квантификатора вопросительный знак. Теперь тот 
же наш поиск имени пользователя должен выглядеть как /.*?:/. Этот *? будет те- 
перь стараться найти не как можно больше символов, а как можно меныше, по- 
этому остановка произойдет после первого двоеточия, а не последнего. 


Как поймать на слове 


При попытке найти соответствие шаблону проверка осуществляется с каждого 
места, пока не будет найдено соответствие. Якорь (апсһог) позволяет ограничить 
область поиска совпадений с птаблоном. В сущности, якорь есть нечто, соответст- 
вующее «ничему», но это «ничто» особое, оно зависит от окружения. Можно на- 
звать это «ничто» также правилом, ограничением. утверждением. Как ни назы- 
вай, якорь пытается найти нечто нулевой длины, успешно или не очень. (Отсутст- 
вие соответствия якорю просто означает, что соответствие шаблону нельзя найти 
этим конкретным способом. Если можно попробовать еще какие-то способы, то 
будут продолжены попытки найти шаблон этими способами.) 


Специальный символ \р соответствует границе слова, которая определяется как 
«ничто» между символом слова (\м) и символом, не принадлежащим слову (\М), 


1 Мы приносим извинения, но это обозначение выбрано не нами, и не стоит винить нас. 


Отрицание классов символов традиционно записывается именно так в культуре ОМІХ. 


2 Не грустите. Даже авторы иногда спотыкаются о подобные вещи. 
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в любом порядке. (Символы, «предшествующие» началу строки или ‹следую- 
щие» после конца строки, не считаются символами слова.) Например: 


/\ОЕгеа\р/ 


будет соответствовать слову Егед как в строке “Тһе бгеаї Ғге0", так и в строке “Егед 
{Бе бгеаї”, но не в строке "Ғгейегіск {пе бгеаї", потому что за @ в слове Егедег1ск не 
следует «символ, не принадлежащий слову». 


В аналогичное русло укладываются якоря, соответствующие началу или концу 
строки. Символ (°), будучи первым символом строки, соответствует «ничему» в на- 
чале строки. Поэтому шаблон /”Егед/ будет соответствовать строке "Егей в Егедег1ск 
(ће Сгеат”, но не в строке "Тһе СгеаЕ Ғгей", тогда как /Егед”/ не найдется ни в одной 
из этих строк. (На самом деле, в последнем выражении вообще мало смысла.) 
Знак доллара ($) работает так же, как ^, нс соответствует «ничему» не в начале, 
а в конце строки. Теперь, вероятно, читатель уже сможет определить, что фраза 


1а51 ІШІМЕ 1# $11те =- /7>/; 


означает «перейти к последней итерации цикла | ІМЕ, если данная строка начина- 
ется с символа >». 


Выше мы сказали, что последовательность \0:7,11} будет соответствовать числу 
длиной от семи до одиннадцати цифр. Будучи абсолютно верным, это утвержде- 
ние вводит в заблуждение: задание этой последовательности в действительном 
операторе поиска по шаблону, /\0{7,11}/, не исключает того, что после одиннадцати 
соответствующих шаблону цифр не окажется других, ему не соответствующих! 
Для получения желаемого результата часто требуется добавлять якори в шабло- 
ны с одного или обоих концов. 


Обратные ссылки 


Ранее говорилось, что объединять элементы, на которые действует квантифика- 
тор, можно с помощью скобок, но можно использовать скобки и для запоминания 
фрагментов найденного. Если заключить часть регулярного выражения в пару 
скобок, символы, соответствующие этой части в найденном, будут сохранены 
и смогут использоваться в дальнейшем. При этом критерии поиска не изменяют- 
ся, поэтому /\0+/ и /(\9+)/ будут искать самую длинную последовательность цифр, 
но в последнем случае найденная последовательность будет сохранена в специ- 
альной переменной, к которой позже можно обратиться. 


Способ обращения к найденной части строки зависит от того, откуда требуется 
выполнить это обращение. Внутри того же самого регулярного выражения это 
делается с помощью обратной косой черты, за которой следует целое число. Целое 
число, соответствующее данной паре скобок, определяется путем подсчета чис- 
ла левых скобок с начала шаблона, начиная с единицы. Например, для поиска 
чего-то похожего на тег НТМГ, типа <В>В010</В>, можно использовать шаблон 
/<(.=?)>.*?<\/\Т/. Он требует, чтобы обе его части в точности соответствовали оди- 
наковой строке, как "В" в данном примере. 


Это некоторое упрощение, поскольку предполагается, что строка не содержит символ 
перевода строки; ^ и $ являются, в сущности, якорями для начала и конца строк в тек- 
сте (пез), а не последовательностей символов (ѕїгіпеѕ). Мы постараемся разобраться 
со всем этим в главе 5 (насколько с этим вообще можно разобраться). 
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Вне самого регулярного выражения, например, в части замены для оператора 
подстановки, используется сочетание $ и целого числа, т.е. обычная скалярная 
переменная, именем которой является число. Поэтому, чтобы переставить места- 
ми первые два слова в строке, можно использовать оператор: 


5/(\5+)\$+(\5+)/$2 $1/ 


В правой части подстановки (между вторым и третьим символами косой черты) 
находится просто необычная разновидность строки в двойных кавычках, поэтому 
и можно производить в ней интерполяцию переменных, включая переменные 
с найденным текстом. Это мощный механизм: интерполяция (в контролируемых 
условиях) — одна из причин, почему Рей является хорошим языком обработки 
текста. Другой причиной, само собой, является поиск по шаблону. Регулярные вы- 
ражения предназначены для того, чтобы разобрать на кусочки, а интерполяция — 
чтобы собрать все вместе снова. Возможно, не все потеряно для Шалтая-Болтая. 


Если использование нумерованных ссылок покажется вам утомительным, в вер- 
сии Рег у5.10 и выше поддерживаются также именованные ссылки. Это те же 
самые подстановки, но на этот раз с использованием именованных групп: 


3/(2<а] рпа>\5+)\$+(?<Бета>\5+)/$+{6ета} $+{а1рһа}/ 


Возможно, их применение увеличит время набора текста программы, но как 
только размеры и сложность ваших шаблонов подрастет, вы будете рады возмож- 
ности именовать группы осмысленными словами вместо простых чисел. 


Таблица 1.8. Ссылки в регулярных выражениях 


Нумерованная группа | Именованная группа 
(2<ИМЯ> 


Объявление 
Внутри того же регулярного выражения | \1 \К<ИМЯ> 
$+{ИМЯ} 


В программном коде на Рей 


Обработка списков 


Где-то в начале этой главы мы говорили, что в Рег! есть два основных контекста: 
скалярный контекст (для работы с отдельными объектами) и списочный кон- 
текст (для работы с наборами объектов). Многие из традиционных операторов, 
встречавшихся в тексте до сих пор, были по своему действию чисто скалярными. 
Они всегда принимают одиночные аргументы (или пары одиночных аргументов 
в бинарных операторах) и всегда производят одиночный результат, даже в спи- 
сочном контексте. Поэтому, если есть запись: 


ваггау = (1 + 2, 3-4, 5 + 6, 7/8); 


то список в правой части содержит ровно четыре значения, поскольку результа- 
том обычных математических операторов всегда являются скалярные величины, 
даже в списочном контексте, возникающем при присваивании массиву. 


Однако другие операторы Регі могут порождать как скалярные, так и списочные 
значения, в зависимости от контекста. Они просто «знают», что от них ожидает- 
ся – скаляр или список. Но как об этом узнает программист? Оказывается, это 
нетрудно сделать, если усвоить некоторые ключевые понятия. 
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Во-первых, списочный контекст должен быть обеспечен «окружением». В пред- 
шествующем примере за это отвечает списочное присваивание. Ранее мы видели, 
что такой контекст предоставлнет оператор цикла ѓогеасћ. Оператор ргігї также 
предоставляет его. Но вам не придется это заучивать. 


Посмотрев на синтаксические сводки, разбросанные по оставшейся части книги, 
можно увидеть операторы, в определении которых в качестве принимаемого аргу- 
мента указан /157. Это и есть операторы, предоставляющие списочный контекст. 
Всюду в этой книге / 157 используется как специфический технический термин, 
означающий «синтаксическая конструкция, предоставляющая списочный кон- 
текст». Например, найдя ѕогї, вы обнаружите такую синтаксическую сводку: 


ѕогі 115Т 


Это значит, что функция ѕогї предоставляет списочный контекст для своих аргу- 
ментов. 


Во-вторых, во время компиляции (когда Ре! производит синтаксический анализ 
программы и транслирует ее во внутренние коды операций) каждый оператор, 
принимающий [15Т, предоставляет списочный контекст для каждого синтакси- 
ческого элемента этого /157Т. Поэтому каждому оператору верхнего уровня или 
объекту в [157 известно на этапе компиляции, что от него ожидается создание са- 
мого лучшего списка, на который он способен. Это означает, что если сказать: 


зогЕ @дидез, @сһіскѕ, оїһег(); 


то каждый из элементов, @дидез, бсһіскѕ и оїћһег(), знает на этапе компиляции, что 
от него ждут список, а не скалярную величину. Для отражения этого компиля- 
тор генерирует соответствующие внутренние коды операций. 


Позже, на этапе выполнения (когда внутренние коды операций интерпретируют- 
ся фактически), каждый из этих элементов в / 157 порождает свой список, а затем 
(это важно) все отдельные списки объединяются вместе, друг за другом, в один об- 
щий список. Этот расплющенный одномерный список и передается в конечном 
итогефункции, которая требовала [ 157. Поэтому, если @дидез содержит (Егед,Вагпеу), 
ёсһіскѕ содержит (\11та,Ветту), а функция оїћег() возвращает список из одного эле- 
мента (01по0), то 1157, который получит 5огт, будет таким: 


(ЕгеЧ, Вагпеу, 1] та, Веїту, Оіпо) 
а 1157, который ѕогі вернет, будет следующим: 
(Ваглеу, Веїту, 01по, Егеа, м1 1та ) 


Одни операторы порождают списки (например, кеуѕ), другие потребляют их (на- 
пример, ргіпі), а третьи преобразуют один список в другой (например, ѕогт). Опе- 
раторы последней категории можно рассматривать как фильтры, но в них, в от- 
личие от оболочки командного интерпретатора, поток данных идет справа нале- 
во, поскольку списочные операторы воздействуют на аргументы, передаваемые 
им справа. Можно расположить подряд несколько списочных операторов: 


рип геуегзе ѕогі пар {1с} Кеуз %һаѕп: 


В этом выражении функция кеуѕ получает ключи из хеша %ћаѕћ и возвращает их 
функции пар, которая переводит их все в нижний регистр, применяя для каждого 
оператор 1с, и передает затем функции ѕогі, которая сортирует их и передает 
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функции геуегѕе, которая обращает порядок элементов списка и передает их 
функции р! 111, которая их выводит. 


Как видите, описать это на Рей куда проще, чем на естественном языке. 


Есть много других ситуаций, когда обработка списка порождает более естествен- 
ный код. Невозможно все их здесь перечислить, но для примера вернемся на ми- 
нуту к регулярным выражениям. Мы уже обсуждали применение шаблонов для 
поиска в скалярном контексте, но если использовать шаблон в списочном контек- 
сте, происходит нечто иное: все ссылки на найденный текст вытаскиваются в ви- 
де списка. Допустим, вы производите поиск в файле журнала или почтовом ящи- 
ке и хотите разобрать строку, содержащую время в формате «12:59:59 ат». Мож- 
но сделать это так: 


ту ($ноиг, %тіп, $ѕес, $атрт) = /(\а+): (\0+): (\9+) *(\м+)/; 


Это удобный способ присвоить значения одновременно нескольким переменным. 
Но ничуть не сложнее сказать: 


ту Өһтѕа = /(\9+): (\9+): (\9+) *(\и+)/; 


и поместить все четыре значения в один массив. Как ни странно, но, отделяя мощь 
регулярных выражений от мощи выражений Рег], списочный контекст увеличи- 
вает мощь языка. Хотя мы редко признаемся в этом, Ре! является не только диа- 
гональным языком. но и фактически ортогональным языком. Можно один пирог 
съесть дважды. 


Чего вы не знаете, то вам (сильно) не навредит 


В заключение позвольте еще раз вернуться к концепции Ре! как естественного 
языка. Говорящие на естественном языке могут иметь разный уровень мастерст- 
ва, предпочитать какие-то подмножества языка, учить язык по ходу дела и обыч- 
но с пользой применять язык, не дожидаясь того времени, когда изучат его цели- 
ком. Вы пока не знаете Ре! целиком, как не знаете целиком и тот язык, на кото- 
ром разговариваете. Но в культуре Ре! это официально считается нормальным. 
Вы можете извлекать пользу из работы с Рей, даже если мы еще не рассказали 
вам, как создавать собственные подпрограммы. Мы едва коснулись вопросов 
применения Рей для системного администрирования, быстрого создания прото- 
типов, сетевого взаимодействия или в качестве объектно-ориентированного язы- 
ка. Об этих вопросах можно написать целые главы. (Если вдуматься, то мы это 
уже сделали.) 

Но в конечном итоге читатель должен выработать собственное отношение к Регі, 
Как художник, вы имеете право на собственные муки творчества. Мы можем по- 
казать, как мы пишем картины, но не можем указывать, как писать картины 
вам. Есть Несколько Способов Сделать Это. 


Получите причитающееся вам удовольствие. 


П 


Анатомия Регі 


Всякая всячина 


Мы начнем с малого и посвятим эту главу элементам Рен. 


Поскольку мы начинаем с малого, продвижение по следующим главам будет вы- 
нужденно происходить от малого к большому. Это значит, что мы выбрали восхо- 
дящий принцип и, начав с мельчайших составляющих программ Рен, будем со- 
бирать из них более сложные конструкции, подобно тому, как молекулы состав- 
ляются из атомов. Недостаток такого подхода в том, что из-за деревьев можно не 
увидеть леса, потерявшись в нагромождении подробностей. Преимущество же 
заключается в том, что вам будут понятны примеры, приводимые по ходу изло- 
жения. (Если вы предпочитаете нисходящий порядок, переверните книгу и чи- 
тайте главы в обратном порядке.) 


Каждая глава базируется на материале предшествующей главы (или последую- 
щей, если вы читаете с конца), поэтому будьте осторожны, если у вас есть при- 
вычка перескакивать через страницы. 


Разумеется, мы только приветствуем, если вы станете подглядывать в справоч- 
ные материалы в конце книги. (Это не считается перескакиванием через страни- 
цы.) В частности, отдельные слова, оформленные моноширинным шрифтом, вы, скорее 
всего, найдете в главе 27. Мы старались сделать изложение не зависящим от опе- 
рационной системы, но, если вы не знакомы с терминологией ОМХ и столкне- 
тесь со словом, как будто имеющим иной смысл, чем вы ожидали, следует поис- 
кать его в глоссарии. Если не поможет глоссарий, то, вероятно, поможет алфавит- 
ный указатель. Если и это не поможет, воспользуйтесь своей любимой поисковой 
системой. 


Атомы 


За кулисами происходит множество незаметных вещей, и вскоре мы о них расска- 
жем, однако самыми маленькими объектами, с которыми обычно приходится ра- 
ботать в РеЙ, являются отдельные символы. Мы говорим именно о символах: 
в прежние времена Ре! легко путал байты с символами, а символы с байтами, но 
в наступившую эпоху глобальных сетей нужно тщательно различать эти две вещи. 
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Можно, конечно, писать на Регі, ориентируясь исключительно на 7-разрядный 
набор символов АЗСП. По историческим причинам Регі считает, что байты в диа- 
пазоне 128—255 относятся к набору символов [30-8859-1 (Г.а@п1), где их коды со- 
ответствуют кодам тех же символов Юникода. Чтобы сообщить интериретатору 
Регі, что текущий файл с исходным программным кодом должен интерпретиро- 
ваться как текст Юникода в кодировке ОТЕ-8, поместите следующее объявление 
в начало файла: 


иѕе иЁ#8; 


Как будет сказано в главе 6, поддержка Юникода появилась в Рег] еще в прошлом 
тысячелетии. Эта поддержка внедрена в язык повсеместно: можно использовать 
символы Юникода как в идентификаторах (например, именах переменных), так 
и в строковых литералах. В случае применения Юникода не нужно беспокоиться 
о том, сколько битов или байтов занимает символ. Рег! представляет дело так, как 
если бы все символы Юникода имели одинаковый размер (а именно 1), даже внут- 
реннее представление того или иного символа требует нескольких байтов. Обычно 
Рег! использует для внутреннего представления ОТЕ-8, кодировку с переменной 
длиной. (Например, «смайлик» © в кодировке Юникода, 0+268А, внутренне пред- 
ставлен последовательностью изтрех символов, но можно не беспокоиться об этом.) 


Если вы позволите несколько развить нашу аналогию с физическими элемента- 
ми, то символы атомарны в том же самом смысле, что и атомы различных элемен- 
тов. Да, они состоят из более мелких частиц, которые называются битами и бай- 
тами, но если расколоть символ на части (разумеется, в ускорителе символов), то 
отдельные биты и байты утратят отличительные «химические» свойства целого 
символа. Как нейтроны являются деталями реализации атома урана-238, так 
и байты являются деталями реализации символа 0+263А. 


Так что не беспокойтесь о мелочах. Переходим к более крупным и приятным ве- 
щам. 


Молекулы 


Рей является языком свободной формы (ўғее-јогт 1апЕиаяе), но эго не значит, что 
код на Ре! вообще бесформенный. Компьютерщики обычно используют этот тер- 
мин для обозначения языка, в котором пробелы, символы табуляции и перевода 
строки можно помещать где угодно - за исключением тех мест, где этого делать 
нельзя. 


Первое очевидное место, в котором нельзя ставить пробельные символы, — это 
внутри лексемы. Лексема (юЁеп) – это последовательность символов с единицей 
смыслового содержания, примерно как слово в естественном языке. Но, в отли- 
чие от обычных слов, лексема может содержать символы, не являющиеся буква- 
ми, и требуется лишь, чтобы они сплоченно составляли смысловую единицу. 
(В этом отношении лексемы более похожи на молекулы, которые не обязательно 
состоят из атомов только одного вида.) Например, числа и математические опера- 
торы считаются лексемами. Идентификатор @4епнйе!) – это лексема, которая 
начинается с буквы или соединительного знака (такого как символ подчеркива- 
ния) и содержит только буквы, комбинируемые знаки!, цифры и символы под- 


1 Кним относятся, например, диакритические знаки. — Прим. ред. 
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черкивания. Лексема не может содержать пробельных символов, поскольку в ре- 
зультате она оказалась бы разбитой на две лексемы; так же пробел в обычном сло- 
ве превращает его в два слова.! 


Пробельный символ допускается помещать между любыми двумя лексемами, но 
обязательным его присутствие является только между такими лексемами, кото- 
рые без него могут быть приняты за одну. Для этой цели могут использоваться 
любые символы из числа пробельных. Символы перевода строки не эквивалент- 
ны пробелам и символам табуляции только внутри строк, заключенных в кавыч- 
ки, внутри форматов и некоторых других последовательностей строчно-ориенти- 
рованной маскировки. Конкретно символ новой строки не служит концом опера- 
тора, как в некоторых других языках (например, ГОВТВАМ или Руіћоп). В Рей 
завершению оператора служит точкой с запятой, как в С и производных языках 
вроде С++ и Јауа. 


Пробельные символы Юникода допускается использовать в программах на Рег! , 
но при этом следует проявлять осторожность. Применяя особые разделители аб- 
зацев и строк из набора символов Юникода, следует учитывать, что Рег! может 
пронумеровать строки не так, как это сделает ваш текстовый редактор, из-за чего 
может усложниться толкование сообщений об ошибках. Лучше придерживаться 
использования старых добрых символов перевода строки. 


Лексемы распознаются путем жадного поиска: если в некотором месте анализа- 
тор Ре! имеет выбор между короткой и длинной лексемами, он предпочтет длин- 
ную. Если вам нужно, чтобы эта лексема считалась за две, вставьте пробельный 
символ в соответствующей точке. (Мы в любом случае стараемся окружать допол- 
нительными пробелами большинство инфиксных операторов, чтобы повысить 
удобочитаемость.) 


Комментарии начинаются с символа # и простираются до конца строки. В отно- 
шении разделения лексем комментарий считается за пробельный символ. В язы- 
ке Ре! содержимое комментария, каким бы оно ни было, не наделяется никаким 
особым смыслом:? 


пу $сотеї = 'НаЈеу # Это - комментарий 


Еще одна особенность связана с тем, что, если строка начинается символом = 
и в этом месте допустим оператор, Рег игнорирует все, начиная с этой строки 
вплоть до строки, начинающейся последовательностью символов =сиї. Игнори- 
руемый текст считается документацией, или ро4 («рат о доситепёайоп»). 
В дистрибутив Рей входят программы, извлекающие комментарии типа роа из 
модулей Рен и преобразующие их в простой текст, страницы руководства, доку- 
менты “ТЕХ, НТМЕ или ХМГ. Анализатор Рей, напротив, извлекает код Рей из 
модулей Ре! и игнорирует рой. Можно рассматривать это как альтернативу, спо- 


Проницательный читатель отметит, что строковые литералы могут содержать пробель- 
ные символы. Но это возможно лишь благодаря двойным кавычкам, которые не дают 
пробелам сбежать. 


Тут мы немножко приврали. Анализатор Ре! все же ищет ключи командной строки 
в начальной строке #! (см. главу 17). Ок может также интерпретировать директивы но- 
мера строки, созданные препроцессором (см. раздел «Генерация Регі из других языков» 
главы 21). Отдельные модули, такие как Рег1:;Сг1{1с и Зтаг{``Соттептз, также использу- 
ют специальные комментарии, чтобы выяснить, что требуется сделать. 
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соб создания многострочных комментариев. Программный код в таком разделе 
роа даже не компилируется: 


=роа 


ту $009 = ‘Зрот’; 
ту $саї = ‘Визтег’; 


=сиї 


Можете не верить, но для модулей Ре], документированных таким способом, до- 
кументация никогда не теряется. О деталях документирования программ рас- 
сказывается в главе 28; там же описывается обработка многострочных коммента- 
риев средствами Рег]. 


Не стоит пренебрегать и обычным символом комментария. Есть что-то умиро- 
творяющее в аккуратной колонке символов # на левой границе многострочного 
комментария. Она немедленно сообщает взгляду: «Это не код». Заметьте, что да 
же в языках, имеющих средства создания многострочных комментариев, таких 
как С, программисты часто все равно помещают колонку символов + по левому 
краю комментариев. Внешний вид часто важнее, чем кажется по внешнему виду: 


# начало многострочного комментария 
# пу $009 = 'роё"; 
# пу $саї = "Визтег`; 


Подобно химии и естественному языку, Регі позволяет строить все более и более 
сложные структуры из простых. Мы уже употребляли слово оператор (ѕіаїетепі): 
это просто последовательность лексем, составляющих вместе команду, т.е. пред- 
ложение в повелительном наклонении. Последовательность команд можно объ- 
единить в блок, который заключается в фигурные скобки (гасез), любовно назы- 
ваемые также «завитушками» теми, кто считает, что Бгасез — это подтяжки! Бло- 
ки, в свою очередь, могут объединяться в еще более крупные блоки. Некоторые 
блоки действуют как подпрограммы (ѕиђгоишіпеѕ), которые могут объединяться 
в модули (тодшез), которые могут объединяться в программы (ргоЕтатз). Но мы 
слишком забегаем вперед — это темы последующих глав. Лучше построим из сим- 
волов еще несколько лексем. 


Встроенные типы данных 


Прежде чем начать разговор о различных типах лексем, которые можно постро- 
ить из символов, требуется ввести еще несколько абстракций. Точнее, нам потре- 
буется три типа данных. 


Языки программирования отличаются числом и видами имеющихся в них типов 
данных. В отличие от некоторых широко распространенных языков, предлагаю- 
щих множество запутанных типов для сходных видов значений, в Рег] довольно 
мало встроенных типов данных. Возьмите С, где можно встретить спаг, ѕһогї, іпї, 
10пд, 1010 10п9д, 6001, мсћһаг ї, 312е_1, оѓ# 1, гедех_\, џіа ї, и Іопо1опо_ї, ріћгеаа кеу т, 
Ғр_ехсерїіоп_Ғіе10 Туре и прочие. И это далеко не исчерпывающий список цело- 
численных типов! А помимо целых есть еще числа с плавающей запятой, а также 
указатели, а также строки. 


1 Другое значение слова гасеѕ. — Прим. перев. 
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Всем этим сложным типам данных в Рег| соответствует единственный тип: ска- 
ляр. (Как правило, потребности разработчика удовлетворяются простыми типа- 
ми данных Рен, но если потребуется что-то более сложное, вы вольны конструи- 
ровать произвольные динамические типы с использованием объектно-ориенти- 
рованных возможностей Регі — см. главу 12.) Основными тремя типами данных 
Рей являются скаляры, массивы скаляров и хеши скаляров (называемые также 
ассоциативными массивами). Некоторые предпочитают называть их не типами, 
а структурами данных. Мы не возражаем. 


Скаляры являются базовым типом, на основе которого строятся более сложные 
структуры. Скаляр хранит одно простое значение, обычно строку или число. Эле- 
менты этого простого типа могут объединяться в один из двух составных типов. 
Массив – это упорядоченный список скаляров, обращение к которым происходит 
с помощью целочисленного индекса (ѕиђѕсгірі). В Рег индексация начинается 
с нуля. Однако, в отличие от многих языков программирования, Рег считает до- 
пустимыми отрицательные индексы, которые ведут обратный отсчет с конца ин- 
дексируемой структуры. (Это относится как к обычному индексированию, так 
ик различным операциям с подстроками и подсписками.) Напротив, хеш являет- 
ся неупорядоченным списком пар ключ/значение, обращение к которым произво- 
дится пугем использования строки (ключа) в качестве индекса для поиска скаля- 
ра (значения), соответствующего данному ключу. Переменные всегда имеют один 
из этих трех типов. Помимо переменных в Регі есть другие абстракции, которые 
можно считать типами данных: например, дескрипторы файлов, дескрипторы 
каталогов, форматы, подпрограммы, таблицы имен и записи таблиц имен. 


Абстракции ~ это чудесно, и по ходу дела у нас их наберется много, но в некото- 
ром отношении они бесполезны. Непосредственно с абстракцией делать ничего 
нельзя. Поэтому в языках программирования имеется синтаксис. Мы должны 
познакомить вас с некоторыми видами синтаксических термов, которые можно 
использовать для объединения абстрактных данных в выражения. Нам нравится 
применять технический термин терм при необходимости поговорить в терминах 
синтаксических единиц. (Хм, похоже, это может создать терминологическую пу- 
таницу. Вспомните просто, что школьный учитель математики говорил о термах 
(членах) в уравнении, и вы не сильно ошибетесь.) 


Подобно членам математического уравнения, назначением термов в Ре! являет- 
ся создание величин, с которыми работают операторы типа сложения и умноже- 
ния. Однако, в отличие от математического уравнения, Рен должен что-то делать 
с величинами, которые он вычисляет, а не просто размышлять с карандашом 
в руке, равны ли между собой две части уравнения. Действие чаще всего состоит 
в том, чтобы где-то запомнить значение: 


$х = $; 


Это пример оператора присваивания (а не оператора равенстве. чисел, который 
в Ре! записывается как =-). Присваивание получает значение из $у и помещает 
его в $х. Обратите внимание, что терм $х используется не ради его значения, а ра- 
ди его адреса. (Прежнее значение $х будет уничтожено присваиванием.) Мы гово- 
рим, что $х является [значением (от 1еѓё уаіџе – левое значение), подразумевая 
под этим, что данный тип памяти может фигурировать в левой части присваива- 
ния. Мы говорим, что $у является г-значением (от гів уае – правое значение), 
поскольку оно расположено в правой части. 
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Есть и третий тип значений, называемый временными значениями, который нуж- 
но понять, если вы и впрямь хотите узнать, что в действительности делает Рей 
с вашими ]1-значением и г-значением. Если мы выполняем какие-то осмысленные 
математические действия и говорим: 


$х = $у +1 


то Рей берет правое значение $у и прибавляет к нему правое значение 1, в резуль- 
тате чего создается временное значение, которое, в конечном итоге, присваивает- 
ся левому значению $х. Возможно, вам будет легче представить себе зрительно, 
что происходит, если мы сообщим, что Рег| запоминает эти временные значения 
во внутренней структуре, называемой стеком! Термы выражения (о которых мы 
говорим в данной главе) стремятся протолкнуть значения в стек, тогда как опера- 
торы выражения (о которых мы будем говорить в следующей главе) стремятся 
вытолкнуть их обратно. В некоторых случаях при этом в стеке остается времен- 
ный результат, с которым будет работать следующий оператор. Все эти проталки- 
вания и выталкивания уравновешиваются: к тому времени, когда вычисление 
выражения заканчивается, стек становится совершенно пуст (или столь же пуст, 
как в начале вычисления). Мы еще поговорим о временных значениях. Некото- 
рые термы могут быть только правыми значениями, как, скажем, 1 (единица) 
в примере выше, тогда как другие могут быть и левыми, и правыми значениями. 
В частности, как показывают вышеприведенные присваивания, переменная спо- 
собна выполнять и ту и другую роль. Этому и посвящен следующий раздел. 


Переменные 


Неудивительно, что существует три типа переменных, соответствующие трем 
описанным выше абстрактным типам данных. Каждой из таких переменных 
предшествует так называемый разыменовывающий префикс ($121).2 Имя скаляр- 
ной переменной всегда начинается символом $, даже если речь о скаляре, являю- 
щемся частью массива или хеша. Действие этого символа несколько напоминает 
использование определенного артикля «ће» в английском языке. См. табл. 2.1. 


Таблица 2.1. Доступ к скалярным значениям. 


Конструкция Значение 


$Чауз Простое скалярное значение $0ауѕ 
$9ауз[28] 


$дауз{ `РеБ’} 


29-й элемент массива @0ауѕ 


Значение “Ееб” из хеша %0ауѕ 


Обратите внимание, что одно и то же имя можно одновременно использовать для 
скаляра $0ауѕ, массива @йауѕ и хеша %дауз, и Рег] не запутается. 


1 Стек действует подобно подпружиненному устройству раздачи тарелок в буфетах – мож- 
но проталкивать (риѕћ) тарелки на вершину стека (стопки), а можно выталкивать 
их (рор) обратно (если воспользоваться профессиональным жаргоном вычислительных 
наук). 


2 По-видимому, потому, что берет обычное имя и делает его необычным. 
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Есть и другие, необычные скалярные термы, применяемые в особых ситуациях, 
в которые мы пока вникать не будем. Они перечислены в табл. 2.2. 


Таблица 2.2. Синтаксис скалярных термов 


Конструкция Значение 


${9ауз} То же, что $0ауѕ, но устраняется неоднозначность перел буквенно- 
цифровыми символами 

$009: :дауз Еще одна переменная $дауз, в пакете 009 

$ндауѕ Последний индекс массива @0ауѕ 

$0ауѕ->[28] 29-й элемент массива, на который указывает ссылка $ауѕ 

$9ауз[01[2] Многомерный массив 


$0ау${2000} {еб} 
$9ауз{2000, `Реб`} 


Многомерный хеш 


Эмуляция многомерного хеша 


Массивы в целом (или срезы массивов и хешей) именуются с помощью разымено- 
вывающего символа @, действующего во многом аналогично словам «эти» или 
«те». Их синтаксис описывается в табл. 2.3. 


Таблица 2.3. Синтаксис списочных термов 


Значение 


Конструкция 


@аауѕ Массив, содержащий ($0ауѕ[0], $0ауѕ[1],... $0ауѕ[п]) 
@Чауз[3, 4, 5] Срез массива, содержащий ($0ауѕ[3], $0ау5[4]., $дау$[5]) 
@аауѕ[3..5] Срез массива, содержащий ($0ауѕ[3], $0ауѕ[4], $оауѕ[5]) 


@дауѕ{`Јап’, 'Реб'} Срез хеша, содержащий ($0аух{`Јап').$0ауѕ{`Ғер ). 


Хеш в целом именуетсн с помощью символа %, как показано в табл. 2.4. 
Таблица 2.4. Синтаксис скалярных термов 


Конструкция Значение 
%дауѕ (Јап => 31, Ғер => $1еар ? 29 28, ) 


Все эти конструкции могут также служить в качестве ]-значений, задавая адрес, 
по которому можно присвоить значение. Для массивов, хешей и срезов массивов 
и хешей 1-значение предоставляет местоположение для присваивания, что дает 
возможность присваивать несколько значений за одну операцию: 


@дауѕ = 1 Т: 


Имена 


Мы говорили о хранении значений в переменных, но и сами переменные (их име- 
на и связанные с ними определения) тоже должны где-то храниться. Теория на- 
зывает такие места пространствами имен (патезрасез). Реті предлагает два вида 
пространств имен, которые часто называются таблицами имен (зутбо] іаЫеѕ) 
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и областями лексической видимости (ежса{ ѕсореѕ)! Таблиц имен и областей 
лексической видимости может быть сколько угодно, и каждое определяемое ва- 
ми имя хранится в той или иной из них. Далее мы рассмотрим оба типа про- 
странств имен, а пока скажем лишь, что таблицы имен являются глобальными 
хешами, содержащими записи таблицы имен для глобальных переменных (в том 
числе хешей для других таблиц имен). Напротив, лексические области видимо- 
сти являются анонимной временной памятью, находящейся не в какой-либо таб- 
лице имен, а прикрепленной к блоку кода вашей программы. Они содержат пере- 
менные, видимые только в данном блоке. (Это мы и подразумеваем под областью 
видимости. Слово лексическая означает, что она относится к тексту, и это совсем 
не то, что подразумевалось бы лексикографом. Не вините нас.) 


В каждом пространстве имен (глобальном или лексическом) переменным каждо- 
го типа отведено собственное подпространство имен, определяемое разыменовы- 
вающим префиксом. Можно, не опасаясь конфликта, использовать одно и то же 
имя для скалярной переменной, массива или хеша (а также дескриптора файла, 
подпрограммы, метки или любимой ручной ламы). Это значит, что $100 и @ѓоо 
суть две различные переменные. Согласно предшествующим правилам, это так- 
же значит, что $ѓоо[1] является элементом б@ѓоо, никак не связанным со скаляр- 
ной переменной $?оо. Это может показаться странным, и правильно, поскольку 
это действительно странно?. 


Имена подпрограмм могут начинаться с символа &, хотя при вызове подпрограмм 
указание разыменовывающего префикса не обязательно. Обычно подпрограммы 
не считаются 1-значениями, но в Рег! разрешается возвращать из подпрограммы 
1-значение и выполнять присваивание по отношению к нему, что выглядит как 
присваивание подпрограмме. 


Иногда требуется имя для «всего, что названо #00», независимо от того, какие ра- 
зыменовывающие префиксы использовались. Поэтому имена записей таблицы 
имен могут начинаться символом +; при этом звездочка обозначает все остальные 
разыменовывающие префиксы. Эти записи называются записями глобальной 
таблицы имен (нуре оз), и существует несколько способов их применить. Они 
могут также выступать в качестве І-значений. Посредством присваивания типу 
данных фуре21оь в Ре! реализуется импорт имен из одной таблицы имен в дру- 
гую. Мы еще расскажем об этом подробнее. 


Подобно большинству языков программирования, Рег! резервирует список слов, 
которые считаются в нем особыми ключевыми словами. Однако поскольку имена 
переменных всегда начинаются с разыменовывающего префикса, зарезервиро- 
ванные слова фактически не конфликтуют с именами переменных. Но некоторые 
другие типы имен не имеют разыменовывающих префиксов ~ как, например, де- 
скрипторы файлов и метки. Что касается таких имен, следует беспокоиться (хотя 
и не сильно) о возможном конфликте с зарезервированными словами. Поскольку 
в большинстве зарезервированных слов применяются только символы в нижнем 
регистре, рекомендуем выбирать имена меток и дескрипторов файлов так, чтобы 


1 В конкретных реализациях Рег! они также называются пакетами (раскавеѕ) и пане 
лями (раа?з), но приведенные нами более длинные названия являются общепринятыми 
терминами в данной области, поэтому мы стараемся придерживаться их. Извините. 


2 Это настолько странно, что в Рег! 6 мы решили сделать все наоборот, что тоже по-сво- 
ему странно. 
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они содержали заглавные буквы. Например, предпочтя ореп(! 0С, 100111е) опасно- 
му ореп(109, “109111е”), вы не введете Регі в заблуждение, будто имеется в виду 
встроенный оператор 109 (который, конечно же, вычисляет логарифмы). Исполь- 
зование символов в верхнем регистре для имен дескрипторов файлов также повы- 
шает удобочитаемость! и предотвращает конфликты с зарезервированными сло- 
вами, которые могут появиться в будущем. По сходным причинам в именах моду- 
лей, созданных пользователем, первую букву обычно делают заглавной: так их 
легче отличать от встроенных модулей, которые называются прагмами и имену- 
ются только в нижнем регистре. А когда мы доберемся до объектно-ориентиро- 
ванного программирования, вы увидите, что имена классов обычно начинают 
с заглавных все по той же причине. 


Как можно было заключить из предыдущего абзаца, регистр символов в иденти- 
фикаторах имеет значение – Е00, Ғоо и Гоо являются в Рег! разными именами. Иден- 
тификаторы начинаются с символа подчеркивания или буквы, могут иметь любую 
длину (где «любая» длина находится в диапазоне от 1 до 251 включительно) и мо- 
гут содержать буквы, цифры и символы подчеркивания. Если вы объявили (иѕе 
ит78), что исходный программный код является текстом Юникода, правила игры 
немного меняются: теперь идентификаторы должны начинаться соединительным 
знаком (такого как символ подчеркивания) или любым символом Юникода, обла- 
дающим свойством ХІ Ѕёагі (ХЭ), за которым может следовать любой символ 
со свойством ХІ Сопёіпие (ХІРС). Это открывает нам свыше 100000 различных 
символов?, которые можно использовать в идентификаторах, в том числе идео- 
граммы, считающиеся буквами, но мы не рекомендуем использовать их, если вы 
не умеете читать их. См. главу 6. 


Имена с разыменовывающими префиксами не обязаны, строго говоря, быть иден- 
тификаторами. Они могут начинаться с цифр, и тогда должны содержать только 
цифры - как, например, имя $123. Имена, начинающиеся с символа, отличного от 
буквы, цифры или соединительного знака, ограничены (обычно) одним символом 
(например, $? или $$) и, как правило, имеют в Регі предопределенное значение. 
Например, как и в оболочке ОМІХ, $$ является идентификатором текущего про- 
цесса, а $? – кодом завершения последнего дочернего процесса. В Ре] также име- 
ется открытый синтаксис для внутренних имен переменкых. Всякая переменная 
вида $(`МАМЕ} является специальной переменной, зарезервированной для исполь- 
зования интерпретатором Рег. Все эти имена, не являющиеся идентификатора- 
ми, принудительно помещаются в главную таблицу имен. Некоторые примеры 
можно найти в главе 25. 


Можно ошибочно прийти к выводу, что имена и идентификаторы — это одно и то 
же, но под именем мы обычно подразумеваем полностью квалифицированное имя, 
т.е. имя, содержащее название своей таблицы имен. Такое имя может быть обра- 
зовано последовательностью идентификаторов, разделяемых лексемой : 


Один из принципов проектирования Рег! заключается в том, что разные вещи должны 
и выглядеть по-разному. Сравните это с языками, в которых делается попытка заста- 
вить разные вещи выглядеть одинаково в ущерб удобочитаемости. 


В версии Юникода у6.0. 


Версия Ре! у5.14 не нормализует имена переменных, поэтому даже при внешней похо- 
жести идентификаторы могут оказаться разными, если в одном используются комби- 
нированные символы, а в другом — составные. 


88 Глава 2. Всякая всячина 


$бапта: :Не1рег: :Веіпдеег: : Нидо1рв: : поѕе 
Это похоже на каталоги и имена файлов в путях файловой системы: 
/Запта/Нне1рег/Везпаеег/Виао1рп/позе 


В версии этого обозначения, используемой Регі, все идентификаторы, кроме по- 
следнего, являются именами вложенных таблиц имен, тогда как последний яьля- 
ется именем переменной в самой глубоко вложенной таблице имен. Например, 
в приведенной ранее переменной именем таблицы является Ѕапїа: :не]рег: :Ве1пдеег: 
:Видо1рн::, а фактическая переменная в этой таблице имен – $поѕе (нос). (А значе- 
нием этой переменной является, конечно. «красный».) 


Таблицу имен в Регі называют также пакетом (раскаве), поэтому соответствую- 
щие переменные часто называются пакетными. Пакетные переменные номиналь- 
но принадлежат пакету, в котором объявлены, но являются глобальными в том 
же смысле, в каком глобальны сами пакеты. Это значит, что каждый может по- 
средством имени пакета добраться и до переменной, просто по ошибке это сделать 
трудно. Например, всякая программа, в которой упоминается $000::бегї, обра- 
щается к переменной $6ег{ из пакета 000::. А это переменная совсем иначе, чем 
$Саі::регї. См. главу 10. 


Переменные, относящиеся к лексической области видимости, не принадлежат 
никакому пакету, поэтому имена переменных с лексической областью видимости 
не могут содержать последовательность символов ``. (Переменные с лексической 
областью видимости объявляются с помошью ключевого слова пу, оџг или ѕїаїе.) 


Поиск имен 


Итак, вопрос: что в имени тебе моем? Как Рег! определяет, что вы имеете в виду, 
обращаясь к переменной с именем $6ег{? Хороший вопрос. Вот правила, которы- 
ми руководствуется анализатор Регі, пытаясь разобрать неквалифицированное 
имя в контексте: 


1. Сначала Ре! просматривает ближайший охватывающий блок и проверяет, 
нет ли в этом блоке данной переменной в объявлениях "у, с.г или зтате (почи- 
тайте о них в главе 27 и разделе «Объявления с областью видимости» главы 4). 
Если объявление пу или ѕїаїе найдено, то переменная имеет лексическую об- 
ласть видимости и не принадлежит какому-либо пакету — она существует 
только в этой лексической области видимости (иначе говоря, во временной па- 
мяти этого блока). Поскольку лексические области видимости безымянны, 
никто вне этого фрагмента кода не может даже упомянуть вашу переменную. 


2. Если переменная не найдена в непосредственно охватывающем блоке, Рей 
ищет блок, охватывающий данный, и переменную с лексической областью 


1 При использовании объявления ог вместо пу или ѕїаїе создается псевдоним с лексиче- 
ской областью видимости для пакетной переменной, а не действительная переменная 
с лексической областью видимости, как происходит в случае объявления пу или ѕїаїе. 
Сторонний код может получить доступ к реальной переменной через ее пакет. но во 
всех остальных отношениях объявление оиг ведет себя как объявление пу. Это удобно, 
если вы пытаетесь ограничить свое собственное использование глобальных перемен- 
ных с помощью прагмы ѕїгісї (см. описание ѕїгісї в главе 5). Но всегда предпочтитель- 
нее использовать пу или ѕїаїе, если вам не нужна глобальная переменная. 
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видимости в этом более широком блоке. В случае успеха Рег! считает, что пе- 
ременная принадлежит только лексической области видимости от точки объ- 
явления до конца блока, в котором она объявлена, включая вложенные блоки, 
например тот, из которого мы пришли на шаге 1. Если Ре! не находит такое 
объявление, он повторяет шаг 2, пока не кончатся охватывающие блоки. 


Когда закончились охватывающие блоки, Ре! рассматривает единицу компи- 
ляции целиком -— и ищет в ней объявления, как если бы она была блоком (еди- 
ницей компиляции является весь текущий файл или строка, компилируемая 
в данный момент оператором еуа1 57АІ№). Если единицей компиляции являет- 
ся файл, то это самая большая лексическая область видимости из возможных, 
и Рен прекращает дальнейший поиск лексических областей видимости, по- 
этому мы переходим к шагу 4. Если жеединицей компиляцией является стро: 
ка, то все не так просто. Строка кода Ре, компилируемая на этапе выполне- 
ния программы, притворяется блоком в лексической области видимости, из 
которой вызван еуа1 5781№0, хотя действительными границами лексической 
области видимости являются не фигурные скобки, а границы строки, содер- 
жащей код. Поэтому, если Рег] не находит переменную в лексической области 
видимости строки, дальнейшие действия исходят из того, что еуа1 5ТАТМ явля- 
ется блоком, поэтому выполняется возврат к шагу 2, только на этот раз поиск 
начинается с лексической области видимости оператора еуа1 5ТАТЮ, а не с об- 
ласти внутри его строки. 


Если мы попали сюда, это значит, что Ре] не нашел для переменной никаких 
объявлений (ни пу, ни оиг). Теперь Рей отказывается от поиска переменной 
с лексической областью видимости и считает, что переменная является пакет- 
ной. Если действует директива $1г1с1, то в данном возникнет ошибка, если 
только эта переменная не является одной из предопределенных переменных 
Реп или не импортирована в текущий пакет. Дело в том. что данная директива 
запрещает использование неквалифицированных глобальных имен. Однако 
мы еще не покончили с лексическими областями видимости. Рег] осуществляет 
такой же поиск лексических областей видимости, как на шагах с 1 по 3, но на 
этот раз ищет не объявления переменных, а объявления пакетов. Если оЕ нахо- 
дит такое объявление пакета, то полагает, что текущий код компилируется для 
указанного пакета, и делает имя объявленного пакета префиксом переменной. 


Не обнаружив объявления пакета в окружающей лексической области види- 
мости, Регі ищет имя переменной в неименованном пакете верхнего уровня, 
именем которого оказывается паіп, если только у него не отсутствует тег име- 
ни. Поэтому, в отсутствие противоречащих тому объявлений, $0егї означает то 
же, что $::регї, что означает то же, что $паіп: :бегї. (Но поскольку паі является 
пакетом в неименованном пакете верхнего уровня, то это также $::таіп: :бегї, 
и фтаіп::таіп::регї, $::таіп::таіп::регі и т.д. Это можно считать бесполезным 
фактом. Однако загляните в раздел «Таблицы имен» главы 10.) 


Есть несколько следствий из этих правил поиска, которые могут быть неочевид- 
ными, поэтому сформулируем их явно. 


Поскольку файл является наибольшей лексической областью видимости из 
возможных, переменную с лексической областью видимости нельзя увидеть 
вне файла, в котором она определена. Файловые области видимости не могут 
быть вложенными. 
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® Любой фрагмент Ре! компилируется, по крайней мере, в одной лексической 
области видимости и ровно в одной области видимости пакета. Обязательной 
лексической областью видимости является, конечно, сам файл. Дополнитель- 
ные лексические области видимости образуют все охватывающие блоки. Весь 
код Ре! компилируется также в области видимости ровно одного пакета, и хо- 
тя объявление любого пакета имеет лексическую область видимости, сами па- 
кеты не ограничены лексически, т.е. являются глобальными. 


» Отсюда следует, что поиск неквалифицированного имени переменной может 
производиться во многих лексических областях видимости, но только в одной 
области видимости пакета — той, которая активна в данный момент (какая 
именно, определяется лексически). 


• Имя переменной может быть связано только с одной областью видимости. Хо- 
тя в любом месте программы действуют, по крайней мере, две разные области 
видимости (лексическая и пакета), переменная может существовать только 
в одной из этих областей видимости. 


• Отсюда следует, что неквалифицированное имя переменной может быть раз- 
решено только в один адрес памяти: либо в первой охватывающей лексиче- 
ской области видимости, где оно объявлено, либо в текущем пакете — но там 
и там одновременно. Поиск прекращается, как только найден адрес памяти, 
а все адреса памяти, которые могли быть найдены при продолжении поиска. 
оказываются в результате скрытыми. 


е Местонахождение обычного имени переменной можно однозначно определить 
на этапе компиляции. 


Теперь вы все знаете о том, как компилятор Рег работает с именами, но иногда 
возникает такая сложность, что на этапе компиляции нужное имя оказывается 
не известно. Иногда требуется обратиться к чему-либо косвенным образом; мы 
называем это задачей косвенного доступа. Ре] предоставляет для этого следую- 
щий механизм: буквенно-цифровое имя переменной можно заменить блоком, со- 
держащим выражение, которое возвращает ссылку на действительные данные. 
Например, вместо 


Фрегтї 
можно сказать: 
${ ѕоте_ехргеѕѕіоп() } 


и если функция ѕопе_ехргеѕѕіоп(\ возвращает ссылку на переменную $0егї (или 
даже строку “бегт”), то это равносильно тому, что вы сразу написали бы $бегї. 
С другой стороны, если функция возвращает ссылку на $егпіе, вы получите дру- 
гую переменную. Продемонстрированный синтаксис является наиболее общим 
(и наименее доходчивым) вариантом косвенного доступа, но мы расскажем о не- 
которых его удобных разновидностях в главе 8. 


Скалярные значения 


Скаляр, будь он поименован прямо или косвенно, находись он в переменной, эле- 
менте массива или временной величине, всегда содержит единственное значение. 
Этим значением может быть число, строка или ссылка на другой фрагмент дан- 
ных. Значение может даже отсутствовать, и в этом случае скаляр называют неоп- 
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ределенным (ипаейпеа). Хотя можно говорить, что скаляр «содержит» число или 
строку, скаляры не имеют типа: не требуется объявлять, что скаляр имеет тип 
целого числа или действительного числа, строки или иной. 


В будущих версиях Рей, возможно, появятся объявления типов 11+, пити зїг, но 
не для того, чтобы осуществлять строгую типизацию, а чтобы помочь оптимиза- 
тору в случаях, когда он не справляется с задачей самостоятельно. Некоторые мо- 
дули в СРАМ уже используют эту возможность. 


Строки в Реп - это последовательности символов без каких-либо искусственных 
ограничений на размер или содержимое. Проще говоря, не требуется решать за- 
ранее, насколько длинными будут строки, а включать в них можно любые симво- 
лы, в том числе нулевые байты. Рег по возможности хранит числа как знаковые 
целые, а если это невозможно, то как величины с плавающей запятой и двойной 
точностью в родном формате машины. Точность значений с плавающей точкой не 
бесконечна. Об этом нужно помнить, иначе равенства типа (10/3 == 1/3*10) по за- 
гадочным причинам не будут выполняться. 


Однако вы можете изменить представления Рей о числах посредством прагм 
рідіпї, рідгаї и рідпит. Они реализуют целые, рациональные (дробные) и вещест- 
венные числа произвольной точности. Это может приблизить фактические ре- 
зультаты арифметических операций к ожидаемым: 

х рег1 -Е ‘зау 10/3 == 1/3*10 ? "Үеѕ” . "М№"' 

№ 


х рег1 -Моідгаї -Е ‘ѕау 10/3 == 1/3*10 ? "Үеѕ” : "М№"' 
Үеѕ 


% рег1 -Е "ѕау 4/3 * 5/12' 
0. 555555555555555 


% рег1 -Мрідгаї -Е ‘зау 4/3 * 5/12'° 
5/9 


Чтобы получить доступ к этим более совершенным числам внутри программы 
(а не в командной строке), следует использовать объявления изе біодіпї, изе рідгаї 
и иѕе Ббідпит: 


иѕе %5. 14; 
иѕе Бідгаї; 
зау 1/3 » 6/5 * 5/4; # выводит “1/2” 


При необходимости Ре осуществляет преобразование между различными под- 
типами, поэтому можно обращаться с числом как со строкой и со строкой как 
с числом, и Рег] будет поступать как должно. Чтобы преобразовать строку в чис- 
ло, Рег] внутренне использует нечтс вроде функции аю{3) из библиотеки С. Что- 
бы преобразовать число в строку, он на большинстве машин осуществляет дейст- 
вие, эквивалентное вызову ѕргілі[(8) с форматом `%.149". Попытки преобразова- 
ния нечисловой строки типа Гоо в число дают в результате числовой 0 и вызывают 
вывод предупреждающих сообщений, если он включен. Примеры определения 
типа данных, содержащихся в строке, можно найти в главе 5. 


Хотя строки и числа почти всегда взаимозаменяемы, со ссылками дело обстоит 
несколько иначе. Ссылка — это строго типизованный, неприводимый указатель 
со встроенным подсчетом ссылок и вызовом деструктора. Это означает, что ссыл- 
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ки можно применять для создания сложных типов данных, в том числе опреде- 
ляемых пользователем объектов. При этом они все же остаются скалярами, пото- 
му что, какой бы сложной ни была структура данных, иногда требуется рассмат- 
ривать ее как одиночное значение. 


Под неприводимостью мы понимаем невозможность, например, преобразовать 
ссылку на массив в ссылку на хеш. Ссылки не преобразуются в другие типы ука- 
зателей. Однако если использовать ссылку как число или строку, то получается 
числовое или строковое значение, которому обеспечено сохранение уникальности 
ссылки, даже несмотря на то, что «ссылочность» значения утрачивается при его 
копировании из действительной ссылки. Такие величины можно сравнивать или 
определять их тип. Но сделать что-либо еще с этими величинами трудно, посколь 
ку нельзя преобразовать числа или строки обратно в ссылки. Обычно это не про- 
блема, ведь Рей не только не принуждает заниматься арифметикой указателей. 
но и вообще не разрешает ее. Дополнительные сведения о ссылках см. в главе 8. 


Числовые литералы 


Числовые литералы задаются в одном из нескольких традиционных! форматов 
для целых и вещественных чисел: 


пу $х = 12345; # целое 

му $х = 12345.67; # вещественное 
пу $х = 6.02е23, # экспоненциальная запись 

пу $х = 4_294 967 296; # подчеркивания для лучшей читаемости 
пу $х = 0377; # восьмеричное 

пу $х = ОхЁҒҒЁҒ; # шестнадцатеричное 

ту $х = 061100_0000; # двоичное 


Поскольку Ре! использует запятую в качестве разделителя в списках, она не может 
выступать в качестве разделителя групп разрядов в больших числах. Для этой цели 
Рей разрешает применять символ подчеркивания. Символ подчеркивания дейст- 
вует только в числовых литералах, определенных в тексте программы, но не в стро- 
ках чисел или данных, прочитанных из любого другого источника. Аналогичным 
образом префиксы 0х для шестнадцатеричных чисел, префиксы 00 — для двоичных, 
и префиксы 0 – для восьмеричных действуют только в литералах. Автоматическое 
преобразование строки в число не распознает эти префиксы: необходимо выпол- 
нять явное преобразование? с помощью функции ост, которая обрабатывает также 
и шестнадцатеричные двоичные числа с префиксами (0х или 00, соответственно. 


Строковые литералы 


Строковые литералы обычно заключаются в одинарные или двойные кавычки. 
Выбор кавычек дает во многом те же результаты, что в оболочке О МХ: для стро- 


1 Традиционных для ОМХ. Если вы из другой культуры, добро пожаловать в нашу! 


2 Иногда программистам кажется, что Ре! следует выполнять за них все необходимые 
преобразования входных данных. Но в реальной жизни слишком много начинающих- 
ся нулями десятичных чисел, чтобы Реп делал это автоматически. Например, почто- 
вый индекс офиса О’ВеШу Медіа в Кембридже, штат Массачусетс, выражается числом 
02140. Почтовое ведомство оказалось бы в замешательстве, преобразуй ваша програм- 
ма печати почтовых наклеек 02140 в десятичное 1120. 
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ковых литералов в двойных кавычках производится интерполяция символа об- 
ратной косой черты (\, раск51аѕ|) и переменных, а для строк в одинарных кавыч- 
ках – нет (за исключением ‘и \\, что позволяет включать одинарные кавычки 
и обратную косую черту в строки, заключенные в одинарные кавычки). Если тре- 
буется встроить другую последовательность обратной косой черты, например, \п 
(перевод строки), то следует выбрать формат в двойных кавычках. (Последователь- 
ности с обратной косой чертой называются также езсаре-последовательностями, 
или экранированными последовательностями, поскольку позволяют временно 
«избежать» обычной интерпретации символов.) 


Строка, заключенная в одинарные кавычки, должна отделяться пробелом от 
предшествующего слова, поскольку одинарная кавычка является допустимым, 
хотя и архаичным, символом идентификатора. Сегодня вместо него используется 
более удобочитаемая последовательность, ::. Это означает, что $та1п`уаг и $та1п: :уаг 
суть одно и то же, но считается, что вторую запись легче читать и человеку, и про- 
грамме. 


Строки, заключенные в двойные кавычки, подвергаются различным видам ин- 
терполяции символов, многие из которых окажутся знакомы программирую- 
щим на других языках. Эти виды интерполяции перечислены в табл. 2.5. 


Таблица 2.5. Экранированные последовательности с обратной косой чертой 


Значение 


\п Перевод строки (обычно І.Е) 

\г Возврат каретки (обычно СК) 

\Е Горизонтальная табуляция 

\Е Подача листа (огт ѓеед) 

\6 Забой (БасКзрасе) 

\а "Тревога (звонок) 

\е ЕБС-символ 

\033 ЕЗС в восьмеричном виде 

\0{33) Другое представление ЕБС в восьмеричном виде 
\х7# ОЕ. в шестнадцатеричном виде 
\х{263а} Символ Юникода с кодом 0х268А 


МА_АТІМ 5МАШ. ІЕТТЕВ Е МТТН АСТЕ} | Символ с именем гАТІЧ змМАШ, ГЕТТЕВ Е МІТН АСОТЕ, «Ё». 


Код символа в Юникоде: ОхЕ9. 
Снова символ ОхЕ9. 
Сопігоі-С 


\сМ№ (+29 } 
\сс 


Запись вида \МНАЗВАНИЕ} применима лишь в сочетании с прагмой сһагпапеѕ, опи- 
санной в главе 29. Она позволяет указывать описательные названия символов — 
например, \МСВЕЕК МАШІ 1ЕТТЕВ 5ІСМА}, \\К9дгеек:5109та} или \№{ѕідта} – в зависимо- 
сти от того, как вызвана прагма. Запись вида \№{0+ШЕСТНАДЦАТЕРИЧНЫЕ ЦИФРЫ} вызо- 
ва прагмы сһагпапеѕ не требует, а кроме того, гарантирует, что для строки или 
регулярного выражения, в которое входит такая запись, будет применяться се- 
мантика Юникода. См. также главу 6. 
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Существуют также экранирующие последовательности, изменяющие регистр 
или «мета-свойства» последующих символов. Они сведены в табл. 2.6. 


Таблица 2.6. Экранирующие последовательности трансляции 


Значение 


Перевести следующий символ в верхний регистр («регистр заголовка» (НЧесазе))* 


\и 


\1 Перевести следующий символ в нижний регистр 

\у Перевести все следующие символы, вплоть до \Е, в верхний регистр 

\Е Перевести все следующие символы, вплоть до \Е, в нижний регистр 

\Е Принудительное приведение к единому регистру всех последующих символов, 
вплоть до \Е 

\0 Добавить обратную косую черту перед всеми последующими символами, не яв- 


ляющимися буквами или цифрами°, вплоть до \Е 


Завершает действие символов \\, \, \Е и \0 


® Регистр заголовка (ИЦесазе) – это регистр Юникода, по преимуществу соответствую- 
щий верхнему регистру. См. главу 6. 

ъ Поддержка экранированной последовательности \Ғ появилась в Ре! у5.16. Единый ре- 
гистр (Фо!9сазе тар) – это особая форма символов, используемая для сравнения без уче- 
та регистра. См. главы 5 и 6. 


Перевод строки можно непосредственно вставлять в строки исходного кода, т.е. 
строка кода может начинаться на одной строке экрана, а завершаться на другой. 
Часто это бывает удобно, но если вы забудете поставить закрывающую кавычку, 
сообщение об ошибке последует только тогда, когда Ре! найдет очередную строку, 
содержащую символ кавычки, а это может произойти значительно позже в коде. 
К счастью, в той же строке обычно сразу возникает синтаксическая ошибка, а Рей 
в этом случае реагирует молниеносно и сообщает место, где, по его мнению, может 
начинаться незавершенная строка. 


Интерполяции в строках, заключенных в двойные кавычки, подвергаются не 
только перечисленные выше экранированные последовательности с обратной ко- 
сой чертой, но также скалярные и списочные значения. Это называется интерпо- 
ляцией переменных. Иначе говоря, значения некоторых переменных можно встав- 
лять непосредственно в строковые литералы. По сути, это просто удобная форма 
конкатенации строк.! Интерполяция переменных может выполняться для скаляр- 
ных переменных, целых массивов (но не хешей), отдельных элементов массива или 
хеша, а также срезов (наборов индексов) массива или хеша. Интерполяция чего- 
либо другого не производится. Иными словами, интерполировать разрешено толь- 
ко выражения, начинающиеся символом $ или @, поскольку это те два символа 
(наряду с обратной косой чертой), которые ищет анализатор строк. Внутри строк 
литерал @, не являющийся частью идентификатора массива или среза. но пред- 
шествующий букве или цифре, должен предваряться обратной косой чертой (\@), 


і Если включен вывод предупреждающих сообщений, Рег| может сообщать об интерпо- 
ляции в строки неопределенных значений как об операциях конкатенации и объеди- 
нения, хотя вы не используете в этих местах такие операторы. Однако их создает за вас 
компилятор. 
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иначе возникает ошибка компиляции. Хотя целиковый хеш, обозначенный сим- 
волом %, невозможно интерполировать в строку, отдельные значения хеша или 
его срезы допустимы, поскольку начинаются символами $и @, соответственно. 


Следующий фрагмент кода напечатает "Цена $100.": 


ту ФРгісе = '$100°, # не интерполируется 
ргіпі “Цена $Рг1се.\п”; # интерполируется 


Как и в некоторых оболочках командной строки, идентификатор можно заклю- 
чить в фигурные скобки, чтобы разграничить его с примыкающими буквами или 
цифрами: "Ном ${уего}а 1 е!". Идентификатор в таких скобках преобразуется в стро- 
ку, как всякий отдельностоящий идентификатор элемента в хеше. Например: 


$0ауѕ { `Ғер'} 
можно записать как: 
$дауз{РеБ} 


и наличие кавычек будет подразумеваться. Более сложный текст в индексе ин- 
терпретируется как выражение и должен быть заключен в кавычки: 


$дауз{ `Ребгиагу 29%1`} # Порядок. 
фдауѕ{"Еергиагу 29%н”} # Тоже порядок. Интерполяция не требуется. 
$Чауз{ Еергиагу 291һ } # НЕВЕРНО, влечет ошибку анализатора. 


В частности, всегда нужно использовать кавычки в таких срезах, как: 


@дауѕ{ `Јап', 'Реб”} # Порядок. 
@аауѕ{ "Јап”, "Реб”} # Тоже порядок 
@аауѕ{ Јап, Ғер } # Не совсем (ошибка при изе ѕїгісї) 


Если не принимать во внимание индексы интерполируемых переменных из мас- 
сивов и хешей, интерполяция предлагает только один уровень вложенности. 
В противоположность ожиданиям людей, привыкших программировать в обо- 
лочках командных интерпретаторов, обратные кавычки (Баскіќіскѕ) не приводят 
к интерполяции внутри двойных кавычек, и одинарные кавычки не препятству- 
ют вычислению переменных, когда используются внутри двойных кавычек. Ин- 
терполяция является очень мощным средством, но в Рег! находится под жестким 
контролем. Она происходит только в границах двойных кавычек и некоторых 
других подобных операций, о которых мы расскажем в следующем разделе: 


ргіпі "\п"; # Порядок, вывод перевода строки. 
ргіпі \п ; # НЕВЕРНО, нет интерполирующего контекста. 


Кавычки на любой вкус 


Хотя обычно мы связываем кавычки с литеральными значениями, в Рег] они дей- 
ствуют скорее как операторы, предоставляя различные возможности интерполя- 
ции и поиска по шаблону. Для этих режимов поведения Ре! предлагает специ- 
альные символы вместо кавычек, а также более общий способ выбора символа 
кавычек для каждого из этих режимов. В табл. 2.7 показано, что вместо / можно 
указать любой буквенно-цифровой символ, отличный от пробельного. (Символы 
перевода строки и пробела больше нельзя использовать в качестве разделителей, 
хотя в доисторических версиях Рег! это разрешалось.) 
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Таблица 2.7. Структуры «закавычивания» 


Пользовательские Значение Интерполируется 


Строка-литерал 
Строка-литерал 
Выполнение команды 


Список слов 


() 


// Поиск по шаблону Да 
5/// Замена по шаблону Да 
Транслирование символов Нет 


г/// 
"= Регулярное выражение 


Некоторые из обозначений являются просто синтаксическими удобствами, избав- 
ляющими от набора многочисленных символов обратной косой черты в строках, 
заключенных в кавычки, особенно при поиске по шаблону, когда и без того легко 
запутаться в символах косой черты (ѕ]аѕћ) и обратной косой черты (Ъаскзаз 1). 


Если выбрать в качестве ограничителя одинарные кавычки, интерполяция пере- 
менных не производится даже в тех форматах, которые обычно интерполируют- 
ся. Если левым ограничителем является открывающая круглая, квадратная, фи- 
гурная или угловая скобка, то правым ограничителем будет соответствующий 
закрывающий символ. (Внедренные ограничители должны иметь попарное соот- 
ветствие.) Примеры: 


ту $31101е = 4!Я сказал: “Ты сказал: `Она сказала это `”!; 


ту $90и61е = 99(Можем мы получить какую-нибудь “хорошую” $уаг1а61е?); 


ту $спипк_оР_собе = д { 
і? (Фсопаіїіоп) { 
ргіпі “Попался! ”; 


}; 


Последний пример показывает, что можно использовать пробельный символ меж- 
ду спецификатором кавычек и левым ограничителем. В двухэлементных конст- 
рукциях, таких как 5/// и 11///, когда первая пара кавычек служит парой скобок, 
вторая часть получает свой собственный символ начальной кавычки. В действи- 
тельности вторая пара не обязательно должна совпадать с первой, поэтому можно 
писать такие вещи, как 5<Гоо>(ъаг) или 1г(а-Р)[А-Е]. Поскольку между двумя внут- 
ренними символами кавычек допускается наличие пробельного символа, по- 
следний пример можно записать даже так: 


{г (а-#) 
[А-Е]; 


Однако пробельные символы недопустимы, когда в качестве кавычек выступает 
символ #. 9#100# разбирается анализатором как строка `Гоо’, ад #То0# ~ как опера- 
тор кавычек 4, за которым следует комментарий. Символ-ограничитель этого 
оператора будет взят со следующей строки. Комментарии можно помещать в се- 
редину двухэлементных конструкций, что позволяет писать: 
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$ {00} Я Заменить Ёоо 


{баг}; # на Баг 
їг [а-Р] # Перевести шестнадцатеричные цифры из нижнего регистра 
[А-Е]; # в верхний 


Можно обойтись вообще без кавычек 


Имя, для которого не нашлось иной интерпретации в грамматике языка, обраба- 
тывается так, как если бы являлось строкой, заключенной в кавычки. Такие 
имена называют голыми словами (Фагешогаз)/ Подобно дескрипторам файлов 
и меткам, голые слова, состоящие исключительно из букв нижнего регистра, мо- 
гут вступать в конфликт со словами, которые будут зарезервированы в будущем. 
Если включен вывод предупреждений, Рег| предостерегает о найденных голых 
слов. Например: 


ту ©ауѕ = (Моп, Тое, меа, Тһи, Егі); 
ргіпї 5Т0О0Т ве11о, ‚ мог1а, “\п”; 


записывает в массив @дауз сокращенные названия дней недели и выводит `ће110 
мог1а" и символ перевода строки в 570007. Если опустить дескриптор файла, Рег 
попытается интерпретировать в качестве дескриптора файла ће110, что приведет 
к синтаксической ошибке. Поскольку применение голых слов чревато возникно- 
вением ошибок, некоторые программисты склонны их избегать вовсе. Перечис- 
ленные выше операторы кавычек предоставляют много удобных форм, в том чис- 
ле 00//, конструкцию «заключения слов в кавычки», которая точно заключает 
в кавычки список слов, разделенных пробелами: 


ту @бауз = дм(Моп Тое меа Тһи Егі); 
ргіпї УТООУТ "һе110 мог1а\п”; 


Можно пойти и на то, чтобы вообще запретить использование голых слов. Если 
сказать: 
иѕе 5їгісї "5005"; 


то каждое голое слово приводит к возникновению ошибки времени компиляции. 
Это ограничение действует на протяжении всей охватывающей области видимо- 
сти. Во вложенной области видимости можно отменить действие этой директивы, 
сказав: 


по ѕїгісї "ѕирѕ" 
Запрет использования голых слов — настолько хорошая идея, что, если сказать: 
иѕе м5. 12; 
или указать более новую версию, Рей включит все ограничения автоматически. 
Обратите внимание, что голые идентификаторы в конструкциях типа: 


"${уегь}аб1е“ 
$дауз{Реб} 


1 Имя переменной, дескриптор файлов, метка и тому подобное не считается за голое сло- 
во, поскольку назначение конструкпии в этом случае определяется предшествующей 
или последующей лексемой (или же обеими). Предварительно объявленные имена, та- 
кие как имена подпрограмм, тоже не являются голыми словами. Голым слово являет- 
ся только в случае, когда анализатор понятия не имеет, что это такое. 
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не считаются голыми словами, поскольку явно разрешены, т.е. не относятся. 
к случаю «отсутствия иной грамматической интерпретации». 


Имя без кавычек, за которым следуют два двоеточия, например, па1п:: или 000::, 
всегда считается именем пакета. На этапе компиляции Рег преобразует потен- 
циально голое слово Сапе1:: в строку Сате1, а стало быть, такое применение не вы- 
зовет осуждения. 


Интерполяция массивов 


Переменные, являющиеся массивами, интерполируются в строки, заключенные 
в двойные кавычки, путем слияния всех элементов массива. Разделитель при 
этом задается в переменной $"! (по умолчанию она содержит пробел). Следующие 
формы эквивалентны: 


пу Фетр = јоіп( $”, @АВбУ ); 
ргіпі $+етр; 


ргіпі “@АВСМ”, 


В шаблонах поиска, где также выполняется интерполяция на манер двойных ка- 
вычек, возникает досадная двусмысленность: следует ли /$ѓоо[раг]/ интерпрети- 
ровать как /${Роо}[раг]/ (где [баг] является классом символов в регулярном выра- 
жении) или как /${ғоо[Баг1}/ (где [Баг] является индексом массива 6100)? Если @ѓоо 
не существует, то это, очевидно, класс символов. Если @Гоо существует, Рен пыта- 
ется угадать, чем является [баг], и почти всегда успешно.? Если он угадывает не- 
верно или вы страдаете паранойей, можно принудительно задать правильную 
интерпретацию с помощью фигурных скобок, как показано выше. Даже если вы 
всего лишь осторожничаете, это, возможно, не столь уж плохая мысль. 


Встроенные документы («Кеге» доситепт{$) 


Строчно-ориентированная форма расстановки кавычек основана на синтаксисе 
встроенных документов (һеге-Поситепі) оболочки ОМГХ. Под строчной ориенти- 
рованностью имеется в виду, что ограничителями являются не символы, а стро- 
ки. Начальным ограничителем является текущая строка исходного кода, а ко- 
нечным — последовательность символов, которую вы задаете. Вслед за << задается 
последовательность символов, которая должна завершить «цитируемый» текст, 
и все строки, следующие за текущей, но исключая завершающую, становятся ча- 
стью строки. Завершающая последовательность может быть идентификатором 
(словом) или некоторым текстом, заключенным в кавычки. В случае применения 
кавычек их тип определяет способ обработки текста, как и при обычном исполь- 
зовании кавычек. Идентификатор без кавычек читается так, как если бы был за- 
ключен в двойные кавычки. Идентификатор, которому предшествует обратная 
косая черта, читается так, как если бы был заключен в одинарные кавычки (для 
совместимости с синтаксисом оболочки). Между << и идентификатором без кавы- 


: $1 15Т ЗЕРАВАТОВ, если используется модуль Епұ]іѕһ, поставляемый с Рег]. 


2 Полное описание алгоритма угадывателя не представляет интереса. Скажем лишь, 
что в его основе лежит сравнение взвешенного среднего всего, что похоже на классы 
символов (2-2, \м, якорь ^), с тем, что похоже на выражения (переменных и зарезерви- 
рованных слов). 
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чек не должно быть пробела, хотя пробельный символ разрешен, если указывает- 
ся не голый идентификатор, а строка в кавычках. (Если вставить пробел, то он 
будет считаться за пустой идентификатор, что допустимо, но осуждается, и соот- 
ветствует первой пустой строке — см. первое Ура! в следующем примере.) Завер- 
шающая последовательность должна располагаться на последней строке в чис- 
том виде, без кавычек и лишних пробельных символов по концам. 


ргіпі <<ЕОЕ, # то же, что в прежнем примере 
цена $Рг1се. 
ЕОЕ 


ргіпі <<”ЕОЕ”; # то же, что выше, но с явными кавычками 
Цена $Ргісе. 
ЕОЕ 


ргіпі <<`Е0Е`; # Одинарные кавычки 

А11 1101193 (е.9. а сате1'5ѕ јоџгпеу їһгоџоћ 

А пеед1е'ѕ еуе) аге ро>ѕір1е, ії'ѕ їгие 

Вие рісїіиге һом {Ве сате1 Ғее15, $дцеехед оиї 
Іп опе 1юпу Б1оойу Е еад, Ргот Таї1 їо ѕпоиї" 


-- 0.5. [ем 
ЕОЕ 
ргіпі <<\ЕОЕ; # другой способ указать одинарные кавычки 
Сейчас мне сильно пригодились бы $100 
ЕОР 


ргіпї << х 10; # вывести следующую строку 10 раз 
Верблюды идут! Ура! Ура! 


ргіпї <<” х 10; # предпочтительный вариант того же 
Верблюды идут! Ура! Ура! 


ргіпі <<`Е0С , # выполнить операторы 
есһо эй, там! 

есһо смотри туда! 

ЕОС 


рг1пі <<"верблюд одногорбый” “саме” #8 можно собрать в кучу 
Я сказал верблюд двугорбый 

верблюд одногорбый 

Она сказала лама 

сапе1іа 


Рипкзпип (<<“ЭТО“, 23, <<'Т0`); # то, что они в скобках, не имеет значения 
Вот строка 

или две строки. 

это 


1 Да, это правда, – многое, и даже все — возможно, 
(Верблюд преодолеет узкие вратг. игольного ушка). 
Но каково быть превращенным в кровавое и длинное страдание 
От морды до хвоста? — Клайв Стейплз Льюис, «Эпитафии и эпиграммы». 
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Вот еще одна. 
то 


Не забывайте ставить точку с запятой в конце оператора, поскольку Реп не дога: 
дается, что вы не собираетесь делать следующее: 


ргіпі <<‘099° 
2345 
ода 
+ 10000; # выведет 12345 


Чтобы встроенный документ имел такой же отступ, как в остальном коде, при- 
дется вручную удалить пробельные символы в начале каждой строки: 
(ту $9иоте = <<'000ТЕ”) =- 5/7\5+//9т; 
тһе Воад доеѕ емег оп апа оп, 


бомп гот їһе доог мћеге 11 Бедап.' 
ОООТЕ 


Можно даже заполнить массив строчками встроенного документа, например: 


ту @заисе$ = <<Епа |іпеѕ =- 0/(\5. *\5)/9; 
обычный томатный 
томатный со специями 
зеленый чили 
песто 
белое вино 
Епа ііпеѕ 


Литералы версий Регі 


Литерал, начинающийся с буквы у, за которой следует одно или несколько целых 
чисел, разделенных точками, считается номером версии: 


иѕе у5.14, # включить строгие ограничения и предугреждения 


(Раньше такие литералы назывались о-строками, но в наши дни их использова- 
ние для создания строковых значений не приветствуется. Теперь такую форму 
записи можно использовать только для определения версий.) 


Другие литеральные лексемы 


Все идентификаторы, начинающиеся и оканчивающиеся удвоенным символом 
подчеркивания, зарезервированы в Ре! для особых синтаксических целей. Двумя 
такими особыми литералами являются _ \№МЕ и __РПЕ__, которые представляют 
текущие номер строки и имя файла в данной точке вашей программы. Их можно 
использовать только как отдельные лексемы, они не интерполируются в строки. 
Аналогично, __РАСКАбЕ_ представляет собой имя пакета, в который компилирует- 
ся текущий код. Лексему __ЕМ__ (а также символы Сопіго]-” или Сопіго]-4) мож- 
но использовать для обозначения логического окончания сценария до фактиче- 
ского конца файла. Любой следующий за ними текст игнорируется, но может 
быть прочитан с помощью файлового дескриптора ВАТА. 


1 Из «Властелина колец» Дж.Р.Р. Толкиена. «Дорога вдаль и вдаль ведет, в ее начале — 
мой порог» (пер. Г. Виноградов). — Прим. ред. 
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Лексема __ПАТА__ действует аналогично лексеме __Е№0__, но открывает дескриптор 
файла АТА в пространстве имен текущего пакета, поэтому в файлах, загружаемых 
посредством гедиіге, могут одновременно быть открыты собственные дескрипторы 
ВАТА. За дополнительными сведениями обратитесь к описанию ГАТА в главе 25. 


Контекст 


Мы уже видели несколько термов, которые могут порождать скалярный кон- 
текст. Однако прежде чем продолжить обсуждение термов, следует договориться 
о значении самого понятия контекста. 


Скалярный и списочный контексты 


Всякая операция! в сценарии Ре! выполняется в конкретном контексте, и харак- 
тер ее действия может зависеть от требований этого контекста. Есть два основных 
контекста: скалярный и списочный. Например, присваивание скалярной пере- 
менной или скалярному элементу массива или хеша приводит к вычислению 
правой части в скалярном контексте: 


$х = Гипкзвип(), # скалярный контекст 
$х[1] = Ғ#ипкѕһип(); # скалярный контекст 
$х{"гау"} = Ғипкећип(): # скалярный контекст 


Однако присваивание массиву или хешу либо срезу того или другого вычисляет 
правую часть в списочном контексте, даже если в срезе выбран только один эле- 
мент: 


@х = Рипкзвип(); # списочный контекст 
@х[1] = Ғипкеһип(); # списочный контекст 
@х{“гау”} = РииКзПип(); # списочный контекст 
%х = Ғипкѕһип();: # списочный контекст 


Присваивание списку скаляров тоже обеспечивает списочный контекст в правой 
части, даже если в списке только один элемент: 


($х, Фу, $2) = ГилкзНип(); # списочный контекст 
($х) Ғопкѕћип(); # списочный контекст 


Правила остаются неизменными при объявлении переменной путем модифика- 
ции терма с помощью пу, ѕїаїе или оиг, поэтому: 


ту $х = Ғипкѕпип(); # скалярный контекст 
пу @х = Ғипкѕһип(); В списочный контекст 
пу х = Ғипкѕһип(), # списочный контекст 
пу ($х) = Ғипкѕһуп(); # списочный контекст 


Не видать вам счастья, пока вы не усвоите различие между скалярным и списоч- 
ным контекстами, поскольку некоторые операторы (такие как гипотетическая 
функция Ғипкѕћип, приведенная нами выше) осознают свой контекст и возвраща- 


В данном случае мы свободно пользуемся термином «операция» для обозначения либо 
оператора, либо терма. Различие между этими двумя понятиями размывается, если 
говорить о функциях, анализируемых как термы, но выглядящих как унарные опера- 
торы. 
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ют список в контекстах, требующих списка, но скалярное значение в контекстах, 
требующих скаляра. (Если это верно для какой-либо операции, об этом говорится 
в ее документации.) На компьютерном жаргоне говорят, что операции перегружа 
ются на основе типа возвращаемого значения. Однако это очень простой вид пе- 
регрузки, основывающийся только на различии между единственным и множе- 
ственными значениями и ни на чем ином. 


Если некоторые операторы реагируют на контекст, то, очевидно, их среда сущест- 
вования должна каким-то образом этот контекст сообщать. Мы показали, что 
присваивание способно предоставлять контекст своему правому операнду, но это 
не должно удивлять, поскольку все операторы предоставляют тот или иной кон- 
текст для каждого из своих операндов. Что нас действительно интересует, так это 
то, какие операторы какой контекст предоставляют своим операндам. Оказыва- 
ется, отличить операторы, порождающие списочный контекст, легко, поскольку 
в их синтаксических описаниях фигурирует слово /15Т, т.е. СПИСОК. Все остальное 
порождает контекст скалярный. Обычно все вполне очевидно.! При необходимости 
можно установить скалярный контекст для аргумента в середине / 157 с помощью 
псевдофункции эса]аг. В Рег нет средства принудительной установки списочного 
контекста в скалярном контексте, поскольку там, где требуется списочный кон- 
текст, он уже обеспечен с помощью / 157 какой-либо управляющей функции. 


Скалярный контекст может быть подразделен нг строковый, числовой и нейт- 
ральный контексты. В противоположность различению скалярного и списочного 
контекстов, операции не имеют возможности и необходимости знать, в котором 
из скалярных контекстов они находятся. Они просто возвращают требуемое ска- 
лярное значение и предоставляют Рег! переводить числа в строки в строковом 
контексте и строки в числа в числовом контексте. В некоторых скалярных кон- 
текстах не важно, возвращается ли строка, число или ссылка, поэтому преобра- 
зование не осуществляется. Это происходит, например, в случае присваивания 
значения другой переменной. Новая переменная просто получает тот же подтип, 
что и старое значение. 


Логический (булев) контекст 


Другим особым произвольным скалярным контекстом является логический кон- 
текст. Логический контекст представляет собой просто любое место, где вычис- 
ляется значение выражения и проверяется его истинность. Когда в этой книгемы 
говорим «ігие» или «Ѓаіѕе», то имеем в виду используемое в Рег! техническое оп- 
ределение: скалярное значение является истинным, если оно не равно пустой 
строке “" или числу 0 (или его строковому эквиваленту, "0”). Ссылка всегда истин- 
на, поскольку представляет адрес, а адрес не может быть нулевым. Неопределен- 
ное значение (часто обозначаемое ипое?) всегда ложно, поскольку является ` или 
0, в зависимости от того, рассматривается ли это значение как строка или как 
число. (Списочные величины не имеют логического значения, поскольку никогда 
не создаются в скалярном контексте!) 


Обратите, однако, внимание на то, что списочный контекст ! 157 может распространять- 
ся на вызов подпрограмм, поэтому не всегда очевидно, будет ли данная команда выпол- 
няться в скалярном или списочном контексте. Программа может определить свой кон- 
текст в подпрограмме с помощью функции мапїаггау. 
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Поскольку логический контекст является нейтральным контекстом, он не вызы- 
вает преобразования скаляров, хотя, конечно, сам скалярный контекст налагает- 
ся на любой операнд, различающий контекст. А для многих различающих опе- 
рандов скаляр, создаваемый ими в скалярном контексте, представляет собой не- 
которое булево значение. Это значит, что операторы, создающие список в списоч- 
ном контексте, могут быть использованы для проверки на {гие/Га1зе в логическом 
контексте. Например, в списочном контексте, производимом оператором џп1іпк, 
имя массива порождает список его значений: 


ип] пк @ғі1еѕ; # Удалить все файлы, игнорируя ошибки. 


Но если использовать массив в условном операторе (т.е. в логическом контексте), 
то массив определяет, что находится в скалярном контексте, и возвращает число 
элементов в массиве, которое является истинным значением, пока в массиве есть 
какие-нибудь элементы. Поэтому, если желательно вывести предупреждения 
для всех файлов, которые не были должным образом удалены, можно написать 
такой цикл: 


мһі1е (@1711ез) { 
пу $711е = 5һі?Е(@ғі1еѕ); 
ип1іпк($ғі1е) || магп "Невозможно удалить $#і1е: $! 


} 


Здесь @ѓі1еѕ вычисляется в логическом контексте, порожденным оператором 
пе, поэтому Ре! вычисляет сам массив и проверяет, является ли он «истинным 
массивом» или «ложным массивом». Истинным массивом он остается, пока в нем 
содержатся имена файлов, но становится ложным, как только из него выталкива- 
ется последнее имя файла. Обратите внимание, что остается справедливым ска- 
занное нами выше. Несмотря на то что массив содержит (и может порождать) спи: 
сочное значение, мы не вычисляем списочное значение в скалярном контексте. 
Мы сообщаем массиву, что он скаляр, и спрашиваем, что он сам о себе думает. 


Не поддавайтесь соблазну использовать для этих целей конструкцию 9е1пе‹ 
6ғі1еѕ. Ничего не получится, потому что функция де 1тед определяет, является 
ли скаляр равным ипдег, но массив — это не скаляр. Достаточно простой логиче 
ской проверки. 


Пустой контекст 


Еще одним специфическим видом скалярного контекста является пустой кон- 
текст. В этом контексте не только безразлично, какого типа значение возвраща- 
ется, но и не требуется возвращать значение. С точки зрения работы функций, он 
не отличается от обычного скалярного контекста. Но если включен вывод преду- 
преждений, компилятор Рег! сообщает о применении выражения без побочных 
эффектов в таком месте, где не требуется значение, например, в операторе, не воз- 
вращающем значение. Например, если в качестве оператора используется строка: 


"Сате1 101”; 
можно получить предупреждение такого вида: 


Џѕе1езѕ иѕе оѓ а сопѕіапі іп \0149 сопіехі іп тургод 1іпе 123; 
[бесполезное использование константы в пустом контексте в тургод, строка 123] 
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Интерполирующий контекст 


Выше мы говорили, что в литеральных строках в двойных кавычках производит- 
ся интерполяция обратной косой черты и переменных, но интерполирующий кон- 
текст (часто называемый контекстом двойных кавычек, поскольку выговорить 
«интерполирующий» невозможно) применяется не только к строкам в двойных 
кавычках. К другим конструкциям подобного типа относятся обобщенный опера- 
тор обратных кавычек дх//, оператор поиска по шаблону п//, оператор подстановки 
5/// и оператор цитирования регулярного выражения дг//. Оператор подстановки 
производит интерполяцию в левой части перед поиском по шаблону, а затем ин- 
терполяцию в правой части при каждом нахождении соответствия левой части. 


Интерполирующий контекст возникает только внутри кавычек или конструк- 
ций, работающих как кавычки, поэтому, может быть, не совсем справедливо на- 
зывать его контекстом в таком же смысле, как скалярный и списочный контек- 
сты. (А может быть, и справедливо.) 


Списочные значения и массивы 


Теперь, когда мы обсудили контексты, можно поговорить о списочных литералах 
и поведении списочных литералов в контексте. Вы уже знакомы со списочными 
литералами. Списочные литералы образуются путем разделения отдельных зна- 
чений запятыми (и заключения списка в круглые скобки, если это требуется для 
расстановки приоритетов). Поскольку (почти) никогда не вредно добавить пару 
лишних скобок, синтаксическая диаграмма списочного значения обычно обозна- 
чается так: 


(Е1$Т) 


Ранее мы говорили, что [15Т в описании синтаксиса указывает на нечто, предо- 
ставляющее списочный контекст для своих аргументов, но голый списочный ли- 
терал является некоторым исключением из этого правила, поскольку предостав- 
ляет списочный контекст своим аргументам, только когда список в целом нахо- 
дится в списочном контексте. Значениями списочного литерала в списочном кон- 
тексте являются просто значения аргументов в заданном порядке. В качестве 
необычной разновидности терма в выражении списочный литерал просто протал- 
кивает ряд временных значений в стек Реп, откуда позже они изымаются операто- 
ром, ожидающим получить список. Однако в скалярном контексте списочный ли- 
терал ведет себя не так, как (.15Т, поскольку не предоставляет списочный контекст 
своим значениям. Вместо этого он просто вычисляет каждый из своих аргументов 
в скалярном контексте и возвращает значение последнего элемента. Это происхо- 
дит потому, что в действительности он представляет собой закамуфлированный 
оператор запятой из С, т.е. бинарным оператором, который всегда отбрасывает 
значение слева и возвращает значение справа. Пользуясь ранее установленным 
словарем, мы можем сказать, что левая сторона оператора запятой, в сущности, 
предоставляет пустой контекст, Поскольку оператор запятой обладает левой ас- 
социативностью, то ряд значений, разделяемых запятыми, приводит в итоге 
к последнему значению, так как последняя запятая отбрасывает все, что произве- 
ли предыдущие запятые. Сравним контексты. Списочное присваивание 


@$ТиЕЕ = (“один”, “два’, “три"); 
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присваивает все списочное значение массиву 6@5ї0ѓї, тогда как скалярное при- 
сваивание: 


фзфиРЕ = (“один”, "два", “три“); 


присваивает только значение «три» переменной $ѕїиѓї. Подобно упоминавшемуся 
выше массиву 6111е5, оператор запятой знает, находится он в скалярном или спи- 
сочном контексте, и действует соответствующим образом. 


Стоит повторить: списочное значение и массив — это разные вещи. Действитель- 
ная переменная массива знает также свой контекст, и в списочном контексте воз- 
вращает свой внутренний список значений как списочный литерал. Но в скаляр- 
ном контексте она возвращает только размер массива. В следующем примере пе- 
ременной $5їи## присваивается значение 3: 


@ѕїиҒҒ = (“один”, “два”, “три“); 
$ЗЪиГЕ = @ѕЇ0ЁЕ; 


Если вы ожидали увидеть значение "три", то, вероятно, сделали неверное обобще- 
ние, предположив, что Ре! использует правило оператора запятой, чтобы отбро- 
сить все, кроме одного, временные значения, которые помещены 0@5їиѓѓ в стек. Но 
дело обстоит не так. Массив @ї0ѓ# не помещал все свои значения в стек. В дейст- 
вительности, он не помещал в стек ни одного своего значения. Он поместил лишь 
одну величину, размер массива, поскольку знал, что находится в скалярном кон- 
тексте. Ни один терм или оператор в скалярном контексте не помещает в стек 
список. Вместо этого он помещает в стек один скаляр (каким бы непривычным 
это ни показалось), который едва ли окажется последним значением списка, ко- 
торое он возвратил бы в списочном контексте, потому что последнее значение 
вряд ли окажется самым полезным значением в скалярном контексте. Уловили? 
(Если нет, лучше перечитайте этот абзац еще раз, поскольку это важно.) 


Теперь вернемся к настоящим [157 – тем, которые образуют списочный контекст. 
До сих пор мы представляли дело так, будто списочные литералы являются просто 
списками литералов. Но подобно тому, как строковый литерал может интерполи- 
ровать другие подстроки, списочный литерал может интерполировать другие под- 
списки. В списке может находиться любое выражение, возвращающее значения. 
Используемые при этом значения могут быть скалярными или списочными, но все 
они становятся частью нового списочного значения, потому что [157 производит 
автоматическую интерполяцию подсписков. Это означает, что при вычислении 
115Т каждый элемент списка вычисляется в списочном контексте, а полученное 
списочное значение интерполируется в 157, как если бы каждый отдельный эле- 
мент был членом /157. Поэтому массивы утрачивают свою индивидуальность 
в (157.1 Список, 


(@5Ти?Ғ, ёпопѕепѕе, Ёипкѕћип( )) 


содержит элементы @5іиѓ?, за которыми следуют элементы @попѕепѕе, а за ними 
следуют те значения, которые подпрограмма &ѓипкѕћи" сочтет нужным вернуть 
в списочном контексте. Обратите внимание, что любая позиция из списка выше 
может интерполироваться в пустой список, и в этом случае все происходит так, 


1 Некоторым кажется, что данное обстоятельство представляет собой проблему, но это 


не так. Всегда можно интерполировать ссылку на массив, если вы не хотите, чтобы он 
утратил свою индивидуальность. См. главу 8. 
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как если бы в этом месте не интерполировался никакой массив или вызов функ- 
ции. Собственно пустой список представляется литералом (). Как и для пустого 
массива, который интерполируется как пустой список и потому фактически иг- 
норируется, интерполяция пустого списка в другой список не оказывает никако- 
го эффекта. Поэтому ((),(),()) эквивалентно (). 


Следствием этого правила является возможность поместить необязательную за- 
пятую в конце любого списочного значения. Это упростит добавление элементов 
в конец списка в будущем: 


@ге]еазез = ( 
“альфа”, 
"бета" 
“гамма”, 


); 


Можно вообще отказаться от запятых: другим способом задания списка литера- 
лов является упомянутый выше синтаксис ди (диоѓе могаѕ, цитирование слов). 
Эта конструкция эквивалентна расщеплению строки в одинарных кавычках по 
пробельным символам. Например: 


@ѓгооїѕ = дм( 


яблоко банан карамболь 
кокос гуава кумкват 
мандарин нектарин персик 
груша хурма слива 


); 


(Обратите внимание, что эти круглые скобки ведут себя не как обычно, а как ка- 
вычки. С таким же успехом это могли быть угловые или фигурные скобки или 
косая черта, прямая или обратная. Но круглые скобки красивее.) 


Со списочным значением можно использовать индексы, как в обычном массиве. 
Во избежание неоднозначности следует заключать список в круглые скобки (на- 
стоящие). Хотн таким способом часто из списка извлекаются отдельные значе- 
ния, на самом деле это срез списка, поэтому синтаксис такой: 


(115Т)[015Т] 
Примеры: 


# 5їаї возвращает списочное значение 
фтоді?ісатіоп_їіте = (ѕтаїі($#і1е))[9] 


# ЗДЕСЬ СИНТАКСИЧЕСКАЯ ОШИБКА. 
фтодіҒісаїіоп +іте = ѕїаї($Ғі1е)[9], # ОЙ, СКОБКИ ЗАБЫЛИ 


# Найти шестнадцатеричную цифру. 
фһехаідії = (`а’.`6`. ‘с’, *9`, 'е'. '#')[901011-10]; 
# "Обратный оператор запятой” 


гефигп (рор(@Роо), рор(@ѓоо) )Г01; 


# Получить несколько значений как срез. 
($0ау, Фтопіһ, $уеаг) = (10са111те)[3,4,5] 
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Списочное присваивание 
Присваивание списку можно осуществлять, только если допустимо присваива- 
ние для каждого элемента списка: 

(Фа, $6, $с) = (1, 2, 3), 


($тар{геа}, $тар{огееп}, Фтар{Ь1ие}) = (0х#70000, 0х00+Р00, 0х0000+г); 


Можно осуществлять присваивание неопределенным элементам (ипде?) в списке. 
Это удобно, если нужно отбросить некоторые значения, возвращаемые функцией: 


($0еу $1тпо, ипдеЁ, опде?, $и19, $919) = этат($е1е), 
Это можно делать даже в объявлениях пу: 

ту (Фаеу, $лпо, ипае?, џпаеї, $014, $919) = ѕта+($Ғі1е); 
Последним элементом списка может быть массив или хеш: 


($а, $6, @геѕї) = 5р1іт; 
ту ($а, $6. Ф%геѕї) = @аго 1151; 


Поместить массив или хеш можно в любом месте списка, которому производится 
присваивание, но первый массив или хеш, встретившийся в списке, поглотит все 
оставшиеся значения, и все последующие элементы списка получат неопределен- 
ные значения. Это можно использовать в 10са1 или пу, когда нужно. чтобы ини- 
циализированные массивы остались пустыми. 


Можно даже осуществлять присваивание пустому списку: 
() = Рипкъһип(); 


Это приводит к вызову функции в списочном контексте с отбрасыванием возвра- 
щаемых значений. Вызови мы такую функцию без присваивания, вызов произо- 
шел бы в пустом контексте, который является разновидностью скалярного кон- 
текста, и при этом функция могла бы повести себя совершенно иначе. Присваива- 
ние списку в скалярном контексте возвращает число элементов, образованных 
выражением в правой части присваивания: 


$х = ( (Фа, $) = (7,7,7) );# присваивает $х 3 а не 2 
фх = ( ($а, $6) = Ғипк() ): # присваивает $х количестве значений возвращаемых ФипКк() 
$х = ( () = ипк) ) # тоже по“сваивает $х -ис"е значений возвращаемых Типк() 


Это удобно в случае присваивания списку в логическом контексте, поскольку 
большинство списочных функций возвращает по завершении пустой список, ко- 
торый при присваивании порождает 0, интерпретируемый как Га1зе. Вот как 
можно использовать это в цикле мй1]е; 


мһ11е (($1091п, $раѕѕмогд) = деїрмепї) { 
1Ё (сгур($10діп Фраѕѕмога) ед Фраѕѕимога) { 
ргіпі “$1001п имеет ненадежный пароль! \п“: 


} 


Размер массива 


Число элементов в массиве @дауз можно определить, вычислив @0ауз в скалярном 
контексте, например: 
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@дауѕ + 0; # неявнағ установка скалярного контекста для @дауз 
зса1аг(@дауз) # явная установка скалярного контекста для @дау$ 


Обратите внимание, что это действует только для массивов. В общем случае для 
списочных значений это не работает. Как уже говорилось, список с разделителем- 
запятой, вычисляемый в скалярном контексте, возвращает последнее значение, 
как оператор запятой в С. Но поскольку в Рег! практически никогда не требуется 
знать размер списка, из-за этого не возникает проблем. 


Со скалярным вычислением @дауз тесно связана переменная $#дау$. Она возвра- 
щает индекс последнего элемента массива, на единицу меньший размера массива. 
поскольку (обычно) имеется нулевой элемент. Присваивание переменной $#9ауз 
изменяет размер массива. Укорачивание массива таким способом уничтожает 
лишние значения. Можно добиться некоторого увеличения эффективности про- 
граммы, заранее увеличивая размер массива, который должен разрастись. (Рас- 
ширить массив можно и присваиванием значения элементу, находящемуся за его 
пределами.) Можно произвести полное усечение массива, присвоив ему пустой 
список (). Следующие строки эквивалентны: 


@мһаїеуег = (); 
$#мпатемег = -1; 


Всегда выполняется и следующее равенство: 
ѕса1аг(@мһа+емег) == $#мпатеуег + 1; 


Усечение массива не высвобождает занимаемую им память. Чтобы вернуть па- 
мять в пул памяти процесса, нужно использовать ипіеѓ(ёмћаїехег) или же выхо- 
дом за пределы области видимости. Вернуть память в пул памяти операционной 
системы, вероятно, не удастся, поскольку мало какие операционные системы под- 
держивают это. 


Хеши 


Как было сказано ранее, хеш является просто необычным видом массива, поиск 
значений в котором осуществляется с помощью ключевых строк, а не чисел. Хеш 
ассоциирует ключи со значениями, поэтому хеши часто называют ассоциатив- 
ными массивами (те, кому не лень набирать такое длинное название). 


На практике в Регі нет такой вещи, как хеш-литерал, но если присвоить хешу 
обычный список, то каждая пара значений в списке образует одну пару ключ/зна- 
чение: 


ту Ятар = ("гед”, 0х#?0000, “дгееп”, ОхООғҒОО, “Б1ие”, 0х0000##) 


Такой же результат получается после выполнения операторов: 


пу Хпар # неинициализированный хеш пуст 
$тар{гед} = 0хғғ0000; 
Фтар{одгееп} = 0х00#?00; 


$тар{61ие} = 0х0000?ғ; 


Часто код легче читать, если использовать оператор => в парах ключ/значение. 
Оператор => служит просто синонимом запятой, но более нагляден и заключает 
в кавычки голые идентификаторы в своей левой части (как идентификаторы в фи- 
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гурных скобках выше), что делает его удобным для нескольких видов операций, 
включая инициализацию переменных типа хеш: 


ту тар = ( 
гей => 0х+1000С, 
дгееп => ОхООғҒОО, 
рое => 0х0000#Ғ, 

); 

или инициализацию ссылок на анонимные хеши, используемые как записи: 

ту $гес = { 
МАМЕ => "Јоһп Ѕті+ћ" 
ВАМК => "Сарїаіп" 
ЅЕАМ№О => "951413", 

}; 


или применение именованных параметров для вызова сложных функций: 


пу фРіе1а = гад1о_дгоир( 
МАМЕ => “животные”, 
МАСЦЕ$ => [“верблюд“, “лама”, "баран", “волк” ], 
РЕРАШТ => “верблюд”, 
(ТМЕВАЕАК => “гие”, 
Г АВЕТ$ => \Жапіта1_патеѕ, 
) 


Но мы снова забегаем вперед. Вернемся к хешам. 


Переменную типа хеш (#һаѕћ) можно использовать в списочном контексте. и в этом 
случае она интерполирует все свои пары ключ/значение в список. То, что хеш 
инициализировался в определенном порядке, не означает, что его значения будут 
возвращаться в том же порядке. В реализации хешей применяются хеш-таблицы 
(для быстрого поиска), в результате чего порядок, в котором элементы хранятся, 
зависит от внутренней хеш-функции, используемой для расчета позиции в хеш- 
таблице, а не чего-либо достойного внимания. Поэтому записи возвращаются 
в порядке, кажущемся случайным. (Разумеется, порядок элементов каждой па- 
ры ключ/значение сохраняется.) Примеры способов упорядочения вывода можно 
найти в описании функции Кеуз в главе 27. 


При вычислении хеш-переменной в скалярном контексте значение їгие возвра- 
щается, если в хеше есть хотя бы одна пара ключ/значение. Если пары ключ/зна- 
чение есть, возвращаемое значение является строкой, состоящей из числа ис- 
пользованных блоков и числа выделенных блоков, разделенных косой чертой. 
В основном это полезно, только чтобы обнаружить, что встроенный алгоритм хе- 
ширования Рег] плохо работает на ваших данных. Например, если вы поместили 
в хеш 10000 значений, и при вычислении %НАЗН в скалярном контексте получили 
"1/8", это означает, что лишь один из восьми блоков используется для хранения. 
Вероятно, в этом одном блоке и содержатся все 10 000 ваших элементов. Скорее 
всего, такого не произойдет. 


Чтобы определить количество ключей в хеше, вызовите функцию Кеуз в скаляр- 
ном контексте: 


зса1аг(кеуѕ(%НАЅН)). 


Многомерный хеш можно эмулировать путем задания в фигурных скобках не- 
скольких ключей, разделенных запятыми. Перечисленные ключи конкатениру- 
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ются, при этом в качестве разделителя выступает содержимое переменной $; ($508- 
ЅСАІРТ ЅЕРАВАТОВ), по умолчанию равное сћг (28). Получившаяся строка используется 
в качестве фактического ключа хеша. Две следующие строки делают одно и то же: 


$реор1е{ $ѕїате, $соџпїу } = $сепѕиѕ_геѕи1ї5; 
$реор1е{ јоіп $; => $ъбате, $соџпїу } = $сепѕиѕ геѕи1їз; 


Эта функция первоначально была реализована для поддержки а2р, транслятора 
из амК в Регі. В нынешние времена вы можете просто использовать настоящий 
(скажем, более настоящий) многомерный массив, как это описывается в главе 9. 
Но в одном случае старый стиль все еще удобен: для хешей, связанных с внешни- 
ми файлами, не поддерживающими многомерные ключи, такие как файлы ОВМ. 


Не путайте эмуляцию многомерных хешей со срезами. Одно представляет ска- 
лярное значение, а другое — списочное: 


фһаѕһ{ $х, Фу, $2 } # одиночное значение 
@һаѕћ $х. Фу. $2 } # срез из трех значений 


Таблицы имен и дескрипторы файлов 


Особый тип Рен под названием йуре о предназначается для хранения целой за- 
писи таблицы имен. (Запись таблицы имен *Гоо содержит значения $Тоо, @ѓоо, %Гоо, 
&Гоо и нескольких интерпретаций старого доброго Гоо.) Разыменовывающим пре- 
фиксом для типа $уре10Ъ является символ +, поскольку он представляет все типы. 


Одним из применений типа $уре]оь (или ссылок на него) является передача и за- 
поминание дескрипторов файлов — это было особенно актуально до появления 
в Ре! ссылок на дескрипторы файлов. Чтобы запомнить голословный дескриптор 
файла, поступите так: 


$Ғһ = *8Т000Т; 

или используйте реальную ссылку: 
$#һ = \*5Т000Т: 

или можно обратиться к разделу таблицы, где хранятся дескрипторы файлов: 
$#һ = *5ТтрО0Т{І0} 


Раньше это было предпочтительным способом создания локального дескриптора 
файла. Например: 


ѕиб пемореп { 
ту Фраён = эН1 ЕЕ; 


1оса1 «ЕН, # ни му(), ни оиг() 
ореп(ЕН, "< , Фрай) || гефигп ипде?; 
гефигп *ЕН; # не \=ЕН! 


} 
ФҒһ = пемореп(” /еіс/раѕѕма" ) 


Однако в настоящее время практически всегда лучше позволить Рей самостоя- 
тельно выбрать имя для дескриптора файла: 


ѕиб пемореп { 
ту $раїһ = ѕһіёї; 
ореп(ту ФЁһ, ‘<’, $раїһ) || гефигп ипдет; 
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гефигп $#һ; 
} 
ФЕһ = пемореп(“ /ес/раѕѕма”): 


Сегодня основным применением ёурев1об оказывается создание псевдонима для 
записи таблицы имен. Псевдоним можно рассматривать как прозвище. Если ска- 
зать: 


*?оо = «баг; 


то все с именем Гоо становится синонимом для соответствующего объекта с име- 
нем раг. Можно создать псевдоним для отдельной переменной из таблицы имен, 
присвоив ссылку: 


«Ғоо = \Фраг; 


При этом $Г00 становится псевдонимом для $раг, но @Тоо не становится псевдони- 
мом для браг, как и %Гоо для %баг. Все это оказывает воздействие только на гло- 
бальные (пакетные) переменные; доступ к лексическим переменным не осуществ- 
ляется через записи таблицы имен. Такое создание псевдонимов для глобальных 
переменных может показаться делом совершенно ненужным, однако на этой функ- 
ции построен весь механизм экспорта/импорта модулей, поскольку нигде не ска- 
зано, что символ, для которого создается псевдоним, должен находиться в том же 
пространстве имен. Конструкция 


10са1 *«Неге::Б1ие = \$Тпеге: :дгееп; 


временно делает $Неге: ие псевдонимом для $ТПеге: :огееп, но не делает @Неге: :51ие 
псевдонимом для @ТПеге: :дгееп или %Неге: :р1ие псевдонимом для %ТПеге: :дгееп. К сча- 
стью, все эти сложные манипуляции с $уре210 скрыты от ваших глаз. Дополни- 
тельное обсуждение фуре2]106 и вопросов импорта можно найти в разделах «Ссыл- 
ки на дескрипторы» и «Ссылки на таблицы имен» главы 8, в разделе «Таблицы 
имен» главы 10, а также в главе 11. 


Операторы ввода 


Есть несколько операторов ввода, которые мы опишем здесь, поскольку они ана- 
лизируются как термы. Иногда их называют псевдолитералами, поскольку во 
многих отношениях они ведут себя как строки в кавычках. (Операторы вывода 
типа рг1п{ анализируются как списочные операторы и обсуждаются в главе 27.) 


Оператор ввода команд (обратные кавычки) 


Прежде всего, в нашем распоряжении имеется оператор ввода команд, известный 
также как оператор «обратные кавычки» (баскіісКкѕ), поскольку он выглядит так: 


фіпғо = ‘рег1дос $тойи1е `; 


Строка, заключенная в обратные кавычки (или, говоря «техническим» языком, 
в грависы), сначала претерпевает интерполяцию переменных, как строка в двой- 
ных кавычках. Затем результат интерпретируется системой как командная стро- 
ка, а выдача команды становится значением псевдолитерала. (Это делается на 
манер аналогичного оператора оболочек ОМХ.) В скалярном контексте возвра- 
щается одна строка, содержащая выдачу. В списочном контексте возвращается 
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список значений, по одному на каждую строку выдачи. (С помощью переменной 
$/ можно назначить иной символ окончания строки.) 


Команда выполняется при всяком вычислении псевдолитерала. Числовой код за- 
вершения команды сохраняется в переменной $? (см. в главе 25 интерпретацию $?, 
известную также, как $СНГ.0_ЕВНОВ). В отличие от версии этой команды в с8й, в воз- 
вращаемых данных не производится трансляция: перевод строки остается пере- 
водом строки. В отличие от всех оболочек, одинарные кавычки в Рег! не защища- 
ют имена переменных в команде от интерпретации. Чтобы передать символ $ обо- 
лочке, нужно защитить этот символ обратной косой чертой. Переменная $пойџе 
в вышеприведенном примере ѓіпсег интерполируется интерпретатором Рен, а не 
оболочкой. (Поскольку команда подвергается обработке оболочкой, возникают 
вопросы защиты данных, рассматриваемые в главе 20.) 


Обобщенной формой «обратных кавычек» является 0х// (от «аиочей ехесиііоп» — 
«выполнение в кавычках»), но оператор действует в точности так же, как обыч- 
ные обратные кавычки. Просто у вас появлнется возможность выбрать собствен- 
ные символы кавычек. Как и в случае аналогичных псевдофункций цитирова- 
ния, если в качестве разделителя выбирается одинарная кавычка, команда не 
подвергается «интерполяции двойных кавычек»: 


фрег1 іпғо = 4х(рѕ $$); # это $$ в Рег] 
$ѕһе11 іпғо = дх'рѕ $$ # это $$ в оболочке 


Оператор ввода строки (угловых скобок) 


Из операторов ввода наиболее интенсивно используется оператор ввода строки, 
который называют также оператором угловых скобок и функцией геад1іпе (по- 
скольку внутренне он вызывает именно ее). Вычисление дескриптора файла в уг- 
ловых скобках (например, ЭТОТ№) дает следующую строку файла, ассоциированно- 
го с дескриптором. (Символ перевода строки включается в состав строки, поэто- 
му, согласно критериям истинности Ре! 1, вновь прочитанная строка всегда явля- 
ется истинной, пока не достигнут конец файла в этот момент возвращается 
неопределенное значение, которое, к счастью, является ложным.) Обычно вход- 
ное значение присваивается переменной, но в одном случае происходит автомати- 
ческое присваивание. Значение автоматически присваивается специальной пере- 
менной $_ — тогда и только тогда, когда в условии цикла »г1-е нет ничегс, кроме 
оператора ввода строки. При этом проверяется, определено ли присвоенное значе- 
ние. (Эта конструкция может показаться странной, но вы будете часто ее исполь- 
зовать, поэтому стоит ее изучить.) Как бы там ни было, следующие строки экви- 
валентны: 


мпіле (деҒіпед($ = <5ТрІМ)) { рглпт $_ } # самый длинный путь 

мһі1е ($ = <5Т0ІМ№) { ргіпі } + явно относительно $ 

мһі1е (<5Т0ІМ№) { ргіпї } # короткий способ 

Рог ({; <5ТрІМ>; ) { ргапЕ } # цикл мћі1е в камуфляже 

рг1пе $_ мһі1е де! 1пед($_ = <5Т0ІМ ); # длинный модификатор оператора 
ргіпі ме $ = <5Т01№, й явно относительно $_ 

ргіпі мһі1е <5Т0ІМ; # короткий модификатор оператора 


Помните, что для этого особого применения требуется цикл мћі1е. Когда оператор 
ввода используется в любом другом месте, результат должен присваиваться явно, 
если требуется сохранить его значение: 
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мр11е (<ЕН1> && <ЕН2>) { } в НЕВЕРНО: отбрасывает оба ввода 


і (<5Т0ІМ) { ргіпі } # НЕВЕРНО: выводит прежнее значение $_ 
ТЕ ($_ = <5Т0ІМ) { ргіпт } # не самое оптимальное” нет проверки определенности 
1Е (деғіпеа($ = <97Т01\№)) { ргіпї ) # самое лучшее 


При неявном присваивании $_ в цикле, использующем $_, это имя указывает на 
глобальную переменную, а не локальную для цикла мћі1е. Существующее значе- 
ние $ можно защитить так: 


мһі1е (1оса1 $ = <5ТрІМ) { ргіпї } # использовать локальную $_ 
или так: 
мһі1е (ту $ = <5ТрІМ№) { ргіпї } # новая. лексическая $_ 


Любое предшествующее значение восстанавливается по завершении цикла. Од- 
нако если не использовать объявление пу или ѕЅїаїе, переменная $_ остается гло- 
бальной, поэтому функции, вызываемые изнутри цикла, могут обращаться к ней 
явным или неявным образом. Этого также можно избежать, объявив лексиче- 
скую переменную: 


мһі1е (ту $іпе = <5Т701№>) { ргіпі $1іпе } # теперь локальная 


(Оба эти цикла мћі1е все же неявно проверяют, является ли определенным резуль- 
тат присваивания, поскольку пу, ѕїаїе и 10са1 не влияют на то, как анализатор вос- 
принимает присваивание.) Дескрипторы файлов 5Т0ІМ, 5Т000Т и ЅТРЕВА являются 
предопределенными и заранее открытыми. Дополнительные дескрипторы файлов 
могут создаваться с помощью функций ореп или ѕуѕореп. Эти функции описывают- 
ся в главе 27. 


В приведенных выше циклах мП11е оператор ввода строки вычислялся в скалярном 
контексте, поэтому возвращал каждую строку отдельно. Однако если использовать 
этот оператор в списочном контексте, возвращается список, состоящий из всех ос- 
тавшихся строк, по одной строке на каждый элемент. Так можно легко создать 0г- 
ромное пространство данных, поэтому применяйте эту функцию с осторожностью: 


фопе_131пе <МУЕТЬЕ>; # Получить первую строку. 
@а11_11пез = <МҮРІГЕ>; # Получить все оставшиеся строки 


Со списочной формой оператора ввода не связаны никакие чудеса ип-1е, посколь- 
ку условие цикла мһ11е всегда предоставляет скалярный контекст (как и всякий 
условный оператор). 


Использование пустого дескриптора файла в операторе угловых скобок представ- 
ляет собой особый случай: оно эмулирует режим командной строки таких типич- 
ных программ-фильтров ОХ, как зе4 и ашЁ. При чтении строк из <> вы чудес- 
ным образом получаете все строки из файлов, перечисленных в командной стро- 
ке. Если никакие файлы не указаны, вы получаете строки из стандартного пото- 
ка ввода, поэтому вашу программу легко внедрить в конвейер процессов. 


Вот как это работает: при первом вычислении <> проверяется массив @АНб\, и если 
он является пустым, то $АНС\[0] устанавливается равным "-", что при открытии 
дает стандартное устройство ввода. После этого массив @АНб\ обрабатывается как 
список имен файлов. Если развернуть цикл 


мћі1е (<>) { 
# код для каждой строки 
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он будет эквивалентен такому псевдокоду в стиле Рег: 


@АВСУ = (-’) ип1езз @АВСУ; # ЭТОТМ, если список пуст, и только тогда 
мһі1е (@АНСУ) { 
ФАВСУ = $Н1РЕ @АНбУ; # каждый раз укорачивать @АВб\У 
і? (!ореп(АЯяб\, `<`, $ААСУ)) { 
магп “Невозможно открыть ФАВСУ: $!\п”; 
пехї; 
} 
мһі1е (<АЯб\У>) { 
# код для каждой строки 
} 
} 


за исключением того, что первый цикл не так утомительно писать, и он действи- 
тельно работает. Он действительно сдвигает массив @АНС\/ и помещает текущее 
имя файла в глобальную переменную $АНСУ. При этом также используется особый 
дескриптор файла АВСб\У, т.е. <> служит просто синонимом более явной записи 
<АВб\У>, являющейся волшебным дескриптором файла. (Псевдокод, приведенный 
выше, не работает, поскольку не считает <АНб\> за волшебный дескриптор.) 


Можно модифицировать @АВбУ до первого обращения к <>, если в итоге этот массив 
будет содержать список тех имен файлов, которые действительно вам нужны. По- 
скольку Ре! использует здесь свою обычную функцию ореп, то имя файла “-", ес- 
ли таковое встретится, считается стандартным потоком ввода, и вам автоматиче- 
ски становятся доступны более экзотические возможности ореп (такие как от- 
крытие «файла» с именем "921р -0с < #і1е.02 |"). Нумерация строк ($.) продолжа- 
ется так, как если бы ввод удачно представлял собой один большой файл. (Однако 
посмотрите в примере для еоѓ в главе 27, как обнулять номера строк для каждого 
входного файла.) 


Если гребуется поместить в @АВС\/ собственный список файлов. то это можно сде- 
лать так: 


# читать файл ВЕАРМЕ, если не заданы аргументы 
@АНС\У = (“ВЕАОМЕ”) оп1еѕѕ @АВбУ; 


При необходимости передать в сценарий ключи командной строки можно сделать 
это с помощью одного из модулей беїорї::* или выполнить сначала цикл такого 
типа: 


мһі1е (@АВбУ апа ФАВСУГО] =- /^-/) { 

$ = эн1 ЕЕ; 

азі і? /7--$/; 

1 (/7-0(.+)/) { $дерид = $1 } 

ЇР (/7-%/) { $уегбоѕе++ } 

иа # прочие ключи 
} 
мһі1е (<>) { 
# код обработки каждой строки 


} 


Оператор <> вернет Га1зе только один раз. Если после этого его вызвать снова, опе- 
ратор будет считать, что обрабатывается еще один список @АВС\, и, если значения 
@АВСУ не присвоены, будет читать данные из 5Т01А. 
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Если строка в угловых скобках является скалярной переменной (например, <$Гоо>), 
то эта переменная содержит косвенный дескриптор файла, являющийся либо 
именем дескриптора файла, из которого нужно брать входные данные, либо ссыл- 
кой на такой дескриптор. Например: 


ФҒһ = \*5ТОТИ; 
$1іпе = <$#һ>: 


или. 


ореп($7һ, ‘<’, "<оаїа. іх”); 
ф1іпе = <$Ғһ>; 


Поиск файлов по маске 


Вас может заинтересовать, что произойдет, если внутрь оператора ввода строки 
поместить что-нибудь более оригинальное. Произойдет вот что: трансформация 
в другой оператор. Если строка в угловых скобках не является именем дескрипто- 
ра файла или скалярной переменной (даже если она просто содержит лишние 
пробелы), она интерпретируется как маска имени файла, в соответствии с кото- 
рой должен осуществляться поиск («е10ђріпе»).! Совпадения с шаблоном отыски- 
ваются в файлах текущего каталога (или каталога, заданного как часть шабло- 
на), и оператор возвращает найденные имена файлов. Как и в случае оператора 
ввода строки, имена возвращаются по одному в скалярном контексте, или все 
сразу в списочном контексте. Обычно встречается последний вариант, и нередко 
можно видеть такие операторы: 


@Рі1е5 = <%, хт1>: 


Как и для других типов псевдолитералов, сначала выполняется один уровене ин- 
терполяции переменных, но для этого нельзя написать <$100>, поскольку, как ска- 
зано выше, это будет воспринято как косвенный дескриптор файла. В прежних 
версиях Рег программисты вызывали принудительную интерпретацию строки 
как маски при помощи фигурных скобок: <${Го0}>. В настоящее время предпочи- 
тают прямой вызов внутренней функции, как в 3100 ‹$ѓоо), что, вероятно, правиль- 
но. Поэтому вместо угловых скобок вы пишете: 


@Г11е$ = 9100(°*.хт1”) 


если с презрением относитесь к перегрузке оператора угловых скобок для этих 
целей. Имеете на это право. 


Применяете вы функцию 0100 или придерживаетесь старой формы с угловыми 
скобками, в любом случае оператор поиска файла по маске, подобно оператору 
ввода строки, осуществляет магию цикла мһі1е, присваивая результат перемен- 
ной $_. (Это изначально было главным обоснованием перегрузки оператора угло- 
вых скобок.) Например, чтобы изменить права доступа ко всем файлам исходных 
текстов на С, можно сказать: 


+ Е1Пее1ор (маска имени файла) не имеет никакого отношения к ранее упомянутым фуре- 
106 (шаблон имени символа), за исключением того, что ь обоих символ * выступает 
в качестве группового. У символа *, используемого с этой целью, есть прозвище «10». 
С помощью ёуревіоь осуществляется поиск одноименных символов в таблице имен. 
С помощью Ё]е=106 осуществляется поиск имен файлов в каталоге по маске, как это 
происходит во многих оболочках. 
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мне (9100 *.с”) { 
сһтод 0644, $ ; 
} 


что эквивалентно: 


мһі1е (<*.с>) { 
Сод 0644, $: 
} 


Функция 0100 в более старых версиях Регі (и еще более старых версиях О МХ) бы- 
ла реализована как команда оболочки, что приводило к относительной дорого- 
визне ее выполнения, а что еще хуже, она по-разному работала в различных сис- 
темах. Сейчас она является встроенной, а потому более надежной и значительно 
более быстрой. 


Конечно, самый короткий способ выполнения приведенной выше функции сһтой 
и, можно утверждать, самый удобочитаемый, — это использование поиска по мас- 
ке как списочного оператора: 


сһтоа 0644, <*. с>, 


Оператор поиска по маске вычисляет свой (внедренный) операнд только при созда- 
нии нового списка. Все значения должны быть прочитаны, прежде чем оператор 
начнет работу снова. В списочном контексте это не важно, поскольку в любом слу- 
чае все значения будут автоматически прочитаны. Но в скалярном контексте опе- 
ратор при каждом вызове возвращает очередное значение или Га15е, если значения 
кончились. Опять же, Га1зе возвращается только один раз. Поэтому, рассчитывая, 
что поиск по шаблону вернет единственное значение, гораздо лучше сказать: 


(фғі1е) = <Б1џ0гсһ*>: # списочный контекст 
чем: 
$Е11е = <Б1игсй»>: # скалярный контекст 


поскольку первая конструкция возвращает все найденные имена и сбрасывает 
оператор поиска, в то время как вторая поочередно возвращает то имена файлов, 
то Га1зе. 


Пытаясь осуществить интерполяцию переменных, явно следует предпочесть опе- 
ратор 9106, поскольку старые обозначения могут быть спутаны с обозначениями 
косвенных дескрипторов файлов. Здесь становится очевидным, что граница меж- 
ду термами и операторами несколько расплывчата: 


@ғі1еѕ = <$091г/*. [сһ]>; # Действует, но лучше избегать. 
@ғі1еѕ = 9106("$91г/-.[с']”) # Вызов 9106 как функции. 
@ғРі1еѕ = 9106 $зоте_раффегп; # Вызов 9106 как оператора 


В последнем примере мы опустили скобки, чтобы показать, что 0100 можно при- 
менять не только как функцию (терм), но и как унарный оператор; т.е. префикс- 
ный оператор, принимающий один аргумент. Оператор 9106 служит примером 
именованного унарного оператора, одного из типов операторов, о которых мы по- 
говорим в следующей главе. Позже мы поговорим еще об операторах поиска по 
шаблону, которые тоже анализируются как термы, но ведут себя как операторы. 


Унарные и бинарные операторы 


В предыдущей главе речь шла о различных типах термов, которые можно исполь- 
зовать в выражениях, но, по правде говоря, одинокие термы скучноваты. Термы, 
в болыпинстве своем, общественные животные. Они любят вступать в связь друг 
с другом. Типичный молодой терм чувствует сильную потребность в сопричастно- 
сти, и ему хочется различными способами оказывать влияние на другие термы, 
однако в обществе существует много видов взаимодействия и много различных 
уровней приверженности. В Ре!| эти взаимоотношения выражаются с помощью 
операторов. 


Должна же социология приносить какую-то пользу. 


С точки зрения математики, операторы являются обычными функциями с особым 
синтаксисом. С точки зрения лингвистики - это просто неправильные глаголы. Но 
любой лингвист обязательно заметит, что неправильные глаголы как раз чаще 
всего используются в языке. И это важно с точки зрения теории информации, по- 
скольку изложение с применением неправильных глаголов как для говорящего, 
так и для слушателя является, как правило, более кратким и более эффективным. 


Говоря будничным языком, работать с операторами удобно. 


Операторы многочисленны, и классифицировать их можно по арности (количе- 
ству мест для операндов), приоритету (степени рвения, с которой они стараются 
отобрать эти операнды у окружающих операторов) и ассоциативности (предпо- 
читаемому порядку работы — слева направо или справа налево — при сочетании 
с операторами, имеющими такой же приоритет). 


По арности различают три вида операторов Регі: унарные, бинарные и тернарныє. 
Унарные операторы всегда являются префиксными (за исключением постфикс- 
ных операторов инкрементирования и декрементирования).! Все остальные опе- 
раторы - инфиксные, если не считать списочные операторы, которые могут быть 
префиксом для любого числа аргументов. Однако большинство воспринимает 


1 Хотя различные кавычки и скобки можно рассматривать как ‹циркумфиксные» опе 
раторы, определяющие границы термов. 
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списочные операторы как обычные функции, вокруг аргументов которых допус- 
кается позабыть поставить скобки. Вот несколько примеров: 


! $х # унарный оператор 
$х » $у # бинарный оператор 
$х ? $у $ # тернарный оператор 


рг1пт $х. Фу, $2 # списковый оператор 


Приоритет оператора определяет прочность связывания его аргументов. Операто- 
ры с более высоким приоритетом захватывают близлежащие аргументы ранее, 
чем операторы с более низким приоритетом. Классический пример на эту тему 
пришел к нам прямиком из элементарной математики, в которой умножение 
имеет более высокий приоритет, чем сложение: 


2+3+4 # дает в результате 14. а не 20 
Порядок выполнения двух операторов с одинаковым приоритетом зависит от их 


ассоциативности. Эти правила тоже до некоторой степени следуют соглашениям, 
принятым в математике: 


2*3*«4 # означает (2 + 3) * 4, левая ассоциативность 
2+» 3 ** 4 # означает 2 ** (3 ** 4), правая ассоциативность 
21=31!=4 # недопустимо, не ассоциативный оператор 


В табл. 3.1 перечислены ассоциативность и арность операторов Рей в порядке 
убывания приоритега. 


Таблица 3.1. Приоритеты операторов 


Ассоциативность Класс приоритета 
Нет 
Слева 
Нет 
Справа 


Термы и списочные операторы (влево) 
-> 
++ -- 


жж 


Справа ' - ли унарные +и - 
Слева 
Слева х / %х 
Слева + - 
Слева <> 
Справа 
Нет 

Нет 


Слева 


Именованные унарные операторы 
<> <= >= Иа 1е уе 


== != <=> ед пе стр -- 


Слева 
Слева 
Слева 
Нет 


Справа 


0 
2 
1 
2 
1 
2 
2 
2 
2 
0,1 
2 
2 
2 
2 
2 
2 
2 
З 


Термы и списочные операторы (влево) 119 


Ассоциативность Арность Класс приоритета 

Справа = += -= = ит.д. 

Слева >. 

Справа Списочные операторы (вправо) 
Справа пої 

Слева апа 

Слева ог хог 


Может показаться, что уровней старшинства слишком много, чтобы их можно 
было запомнить. И это правда. К счастью, есть два облегчающих обстоятельства. 
Во-первых, уровни приоритетов определены так, что обычно соответствуют ин- 
туитивным представлениям, если у вас все в порядке с головой. А во-вторых, те, 
у кого нервы пошаливают, всегда могут поставить пару лишних скобок, чтобы 
избавиться от мучительного беспокойства. 


Еще один полезный совет: операторы, заимствованные из С, сохраняют по отно- 
шению друг к другу принятые там приоритеты, даже когда в С для них установле- 
но довольно странное старшинство. (Это облегчает изучение Регі тем, кто знает С 
и С++. И, может быть, даже Тата.) 


В последующих разделах будет рассказано об этих операторах в порядке стар- 
шинства. За очень редкими исключениями, все они оперируют только скалярны- 
ми величинами, а не списками. По необходимости мы будем указывать на исклю- 
чения из этого правила. 


Хотя ссылки и являются скалярными величинами, применение большинства 
этих операторов к ссылкам не имеет особого смысла, поскольку числовое значе- 
ние ссылки полезно лишь для внутренних механизмов Ре! |. Однако если ссылка 
указывает на объект класса, допускающего перегрузку, то к такому объекту эти 
операторы можно применять, а если в классе определена перегрузка некоторого 
оператора, то она определяет действие над объектом при применении к нему дан- 
ного оператора. Таким способом, например, в Рег! реализованы комплёксные 
числа. Более подробно перегрузка рассматривается в главе 13. 


Термы и списочные операторы (влево) 


Любой терм имеет в Рег] высший приоритет. В число термов входят переменные, 
операторы кавычек и подобные им, большинство выражений в круглых, квадрат- 
ных или фигурных скобках и любые функций, аргументы которых заключены 
в скобки. Если разобраться, то такая вещь, как функция, не существует, есть 
только списочные и унарные операторы, ведущие себя как функции, поскольку 
их аргументы заключены в круглые скобки. Тем не менее, мы назвали главу 27 
«Функции». 


Теперь слушайте внимательно. Есть пара очень важных правил, существенно уп- 
рощающих дело, но приводящих иногда к неожиданным результатам, если не 
проявлять осмотрительность. Если следующей за списочным оператором (напри- 
мер, ргіпї) или любым именованным унарным оператором (например, сһіг) лек- 
семой оказывается левая круглая скобка (не считая пробельных символов), то 
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оператор и аргументы в скобках получают высший приоритет, как если бы это 
был обычный вызов функции. Правило такое: если это похоже на вызов функ- 
ции, то это и есть вызов функции. Можно сделать так, чтобы он не выглядел как 
функция, поместив перед скобками унарный плюс, который, семантически гово- 
ря, не делает абсолютно ничего — даже не преобразует аргумент в число. 


Например, поскольку || имеет более низкий приоритет, чем с|01г, мы получим: 


сҺдіг $Тоо И 91е; # (спаіг $Род) || діе 
сһдіг($Ғоо) || 91е; й (сһадіг $тоо) || сіе 
сһадіг ($00) || іе; # (спадіг $ғоо) || 91е 
сһӧіг +($Ғоо) || 91е: й (сһаіг $тоо) || де 


но * имеет более высокий приоритет, чем сћбіг, поэтому: 


сһадіг $Ғоо * 20, н сһаіг ($Ғоо * 20) 
сһаіг($#оо) * 20; н (сһаіг $00) * 20 
сһдіг ($Ғоо) * 20; # (спд1г $Ғоо) * 20 
спаіг +($Ғоо) + 20; # сһаіг ($00 * 20) 


Аналогично для любого числового оператора, который является именованным 
унарным оператором, например оператора гапо: 


гап 10 * 20; # гапа (10 * 20) 
гапй(10) * 20, # (гапа 10) • 20 
гапа (10) + 20; # (гапа 10) * 20 
гайд +(10) + 20; # гап (10 * 20) 


В отсутствие круглых скобок приоритет списочных операторов, таких как ргіпї, 
ѕогї или сһптой, оказывается либо очень высоким, либо очень низким, в зависимо- 
сти от того, на какую сторону оператора смотреть — левую или правую. (Это и есть 
«влево», выведенное в заголовок этого раздела.) Например, в таком коде: 


пу @агу = (1, 3, ѕогі 4, 2); 
ргіпі багу; # выведет 1324 


запятые справа от ѕогї вычисляются перед вызовом 50гї, но запятые слева вычис- 
ляются после него. Иными словами, списочный оператор стремится проглотить 
все аргументы, которые следуют после него, а затем вести себя как простой терм 
в предшествующем выражении. Но со скобками все же нужно обращаться осто- 
рожно: 


# Эти операторы выполняют ех1ї раньше, чем ргіпі: 
ргіпі($Ғоо, ехії) # Очевидно, это не то. что нужно. 
ргіпі $00, ехії; # Как и это. 


# Эти операторы выполняют ргіпї раньше, чем ехії: 
(ргіпі $Ғоо), ехії; # Это то, что нужно. 
ргіпї($#оо), ехії; НИ эго 


Чаще всего обжигаются на использовании скобок для группировки математиче- 
ских аргументов, забывая при этом, что скобки применяются также для группи- 
ровки аргументов функций: 


ргіпі ($00 & 255) + 1, “\п"; # выведет (Фғоо & 255) 
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Это работает, скорее всего, не так, как вы рассчитывали. К счастью, ошибки та- 
кого вида обычно вызывают вывод предупреждений вроде "/5е]езз$ изе оѓ ад911оп 
(+) іп а \014 сопіехі” (бесполезное сложение в пустом контексте) и “р"1пт (...) іп- 
Тегргетед аз Ғипсїіоп” (ргіпі (...) интерпретируется как функция), если вывод пре- 
дупреждений включен. Второе сообщение напоминает, что круглые скобки счи- 
таются ограничителями списка аргументов, и что все остальное, находящееся за 
их пределами, не является частью этого списка аргументов. Вот как следует за- 
писывать подобные конструкции: 


ргзпт( ($100 & 255) +1 “\п"); я выведет ($00 & 255)+1 


Анализатор также считает термами конструкции 00 {} ие\а1 {}, вызовы подпро- 
грамм и методов, конструкторы анонимных массивов и хешей [] и {}, а также ано- 
нимный конструктор подпрограмм зи {}. 


Оператор «стрелка» 


Точно так же, как в Си С++, бинарный оператор -> является инфиксным операто- 
ром разыменования. Если правая часть представляет собой индекс массива [. .], 
индекс хеша {. } или список аргументов подпрограммы (...), то левая часть долж- 
на быть ссылкой? на массив, хеш и подпрограмму, соответственно: 


$агеғ->[42] # разыменование массивг 
$һге? ->{"согпед бее?" } # разыменование хеша 
$зге!->(1,2,3) # разыменование подпрограммы 


В контексте 1-значения (допускающем присваивание), когда левая часть не явля- 
ется ссылкой, она должна быть неким адресом, по которому может храниться 
жесткая ссылка, и в этом случае происходит самооживление (виюийлйсаНоп) та- 
кой ссылки. 


фагеғ->[42] = 'Ний!*, # самооживление массива в $агеѓ 
$һге?->{ "согпей БееЁ“”} = 0; # самооживление хеша в $ћге“ 


В любом случае такое использованиє создает новый элемент массива или хеша 
с присвоенным значением. Более подробно об этом (с некоторыми предупрежде- 
ниями относительно случайного самоооживления) рассказано в главе 8. 


Справа от стрелки должны находиться либо скобки того или иного вида, либо вы- 
зов некоторого метода. Правая часть должна быть именем метода (или простой 
скалярной переменной, содержащей имя метода), а левая часть должна вычис- 
ляться как объект (связанная с объектом ссылка) или имя класса (т.е. имя пакета): 


ту $уод1 = Веаг->пем( "Үод1"); # вызов метода класса 
$уоді->ѕміре( ‘корзина с елой'): # вызов метода объекта 


Имя метода может быть квалифицировано именем пакета для указания класса, 
с которого нужно начать поиск метода, либо специальным именем пакета Ѕ1РЕН::, 
указывающим, что поиск должен быть начат с родительского класса. См. главу 12. 


Именно поэтому данная проблема будет исправлена в Рег] 6. Увы, ее нє так-то просто 
исправить в Регі 5, сохранив работоспособность существующих программ. 


2 Это может быть символическая ссылка, но только когда прагма ѕігісї не действует. 
В противном случае это должна быть жесткая ссылка. 
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Автоинкрементирование 
и автодекрементирование 


Операторы ++ и -- действуют так же, как в С. Это значит, что, будучи помещенны- 
ми перед переменной, они инкрементируют или декрементируют переменную, 
перед тем как вернуть ее значение, а будучи помещенными после нее, они инкре- 
ментируют или декрементируют переменную после того, как прочитано ее значе- 
ние. Например, $а++ инкрементирует значение скалярной переменной $а, возвра- 
щая ее значение перед выполнением инкрементирования. Аналогично - -$0{(/(\ 
м+)/)[0]} декрементирует элемент хеша %0 с индексом, равным первому «слову» 
в установленной по умолчанию для поиска переменной ($_) и возвращает значе- 
ние, полученное после декрементирования.! Имейте в виду, что как и язык С, Регі 
не определяет конкретный момент, когда произойдет инкрементирование или 
декрементирование. Известно лишь, что оно произойдет до или после возврата 
значения. Это означает, что попытка дважды применить эти операторы в одном 
выражении к одной и той же переменной может привести к неожиданным ре- 
зультатам. Избегайте таких выражений: 

$1 = $1++; 

ргіпі ++$1 + $1++; 


Рег] не гарантирует однозначное выполнение такого кода. 


В оператор автоинкрементирования встроено еще одно «волшебное» свойство. 
При инкрементировании числовой переменной или переменной, когда-либо упо- 
минавшейся в числовом контексте, мы получаем обычное приращение на едини- 
цу. Если, однако, переменная после присваивания ей значения использовалась 
только в строковом контексте и имеет значение, отличное от пустой строки и со- 
ответствующее шаблону /“[а-гА-2]*[0-9]»\2/, то выполняется инкрементирование 
строки с сохранением символов в этом диапазоне и переносом: 


ту $Роо; 

фғоо = "99°; ргіпї ++$600; # выведет “100 
$Роо = "а9”; рглп® ++$Р00; # выведет 00” 
ФҒџо = "А2"; ргіпі ++$#оО, # выведет Ва’ 
$00 = “22”; ргіпі ++$Ғоо; # вьведет “ааа 


Неопределенное значение всегда интерпретируется как числовое и перед инкре- 
ментированием приобретает значение 0, поэтому постфиксный оператор автоин- 
кремента вернет 0, а не ипдет. 


На самом деле, это не совсем честно. Мы просто хотели проверить вашу вниматель- 
ность. Вот как работает это выражение. Сначала поиск по шаблону находит первое сло- 
во в $, используя регулярное выражение \м+. Благодаря окружающим его скобкам 
найденное значение возвращается как список из одного элемента, поскольку поиск по 
шаблону выполняется в списочном контексте. Списочный контекст предоставляется 
оператором среза списка, (...)[0], который возвращает первый (и единственный) эле- 
мент списка. Это значение используется как ключ для хеша, элемент хеша (значение) 
декрементируется и возвращается. В общем, сталкиваясь со сложным выражением, 
анализируйте его в направлении «изнутри – наружу», чтобы установить порядок. в ко- 
тором происходят события. 


Возведение в степень 123 


На момент написания книги волшебное автоинкрементирование не распростра- 
нялось на буквы и цифры Юникода, но в будущем это может произойти. 


Оператор автодекрементирования волшебным не является. 


Возведение в степень 


Бинарный оператор +* осуществляет возведение в степень. Обратите внимание, 
что он связывает аргументы даже сильнее, чем унарный минус, поэтому -2*»4 
равно -(2**4), ане (-2)**4. Этот оператор реализован с помощью С-функции рош(8), 
работа которой строится на числах с плавающей запятой. Расчет выполняется 
с использованием логарифмов, поэтому можно возводить и в дробные степени, но 
иногда получаемые результаты не столь точны, какими могли бы быть при обыч- 
ном умножении. 


Идеографические унарные операторы 


Большинству унарных операторов назначены имена (см. раздел «Именованные 
унарные операторы и операторы проверки файлов» далее в этой главе), но некото- 
рые операторы считаются настолько важными, что заслужили собственное осо- 
бое символическое представление. Все эти операторы, похоже, связаны с отрица- 
нием. Вините математиков. 


Унарный ! осуществляет логическое отрицание, т.е. «не». Вариант логического 
отрицания с более низким приоритетом – пої. Значением отрицаемого операнда 
становится «истина», или {гие (1), если операнд есть «ложь», или Га1зе, (число 0, 
строка `0", пустая строка или неопределенное значение), и «ложь», или ѓа15е, (“"), 
если операнд есть «истина». 


Унарный минус (-) осуществляет арифметическое отрицание, если операнд явля- 
ется числом. Если операнд представляет собой идентификатор, то возвращается 
строка, состоящая из знака «минус», конкатенированного с идентификатором. 
Виных случаях, если строка начинается со знака «плюс» или «минус», возвраща- 
ется строка, начинающаяся с противоположного знака. Отсюда, в частности, сле- 
дует, что -багемога эквивалентно “-Багемога".1 Но если строка начинается любым 
символом, кроме буквы, «+» или «-», Ре попытается преобразовать строку в чис- 
ло и выполнить арифметическое отрицание. Если строка не может быть преобра- 
зована в число, Рег] выдаст предупреждение “АгдитепЕ їће ѕїгіпо” іѕп'ї пимегас іп 
педаїіоп (-)” («Аргумент `їһе ѕїгіпд” не является числом в операции арифметиче- 
ского отрицания (-)»). 


Унарная тильда (-) осуществляет поразрядное отрицание, т.е. дополнение до еди- 
ницы. Например, выражение 0666 & -027 даст в результате 0640. Из определения 
следует, что этот оператор не вполне переносим, поскольку связан с размером ма- 
шинного слова. Например, на 32-разрядной машине -123 равно 4294967172, а на 
64-разрядной равно 18446744073709551492. Но об этом читатель уже знает. 


1 Это очень удобно для программирующих на ТК. Для них, собственно, это соглашение 


и было введено первоначально. 
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О чем он, возможно, не знает, так это о том, что если аргументом оператора - ока- 
зывается не число, а строка, то возвращается строка той же длины, но все разря- 
ды ее являются дополнениями до единицы. Это быстрый способ «перекинуть» за 
одно обращение большое количество битов, и способ, к тому же, переносимый, 
поскольку результат не зависит от размера маптинного слова. Далее мы еще рас- 
скажем о поразрядных логических операторах, имеющих варианты, ориентиро- 
ванные на строки. 


Если коды всех символов в дополняемой строке не превышают значения 256, это 
же ограничение сохранится и для дополнения. В противном случае все символы 
будут приведены к 32- или 64-битным значениям, в зависимости от аппаратной ар- 
хитектуры, и затем дополнены. Так, например, выражение -"\х{381}" даст резуль- 
тат "\х{РЕЕЕР_РСАЕ}" на 32-битной машине и “\х{РЕЕЕ_РЕЕЕ_РЕЕР_РС4Е}” на 64-битной. 


Унарный плюс (+) не оказывает никакого семантического действия — даже на 
строки. Его синтаксическая польза состоит в отделении имени функции от выра- 
жения в скобках, которое иначе интерпретировалось бы как полный список аргу- 
ментов функции. (См. примеры раздела «Термы и списочные операторы» данной 
главы.) Можно представить себе это и так, что + отрицает действие скобок по пре- 
вращению префиксных операторов в функции. 


Унарный оператор \ создает ссылку на то, что следует за ним. Применение его 
к списку создает список ссылок. Подробности можно найти в разделе «Оператор 
обратной косой черты» главы 8. Не путайте действие этого оператора с действием 
обратной косой черты внутри строки, хотя в обоих случаях присутствует некото- 
рая идея отрицания, защищающего последующий объект от интерпретации. Это 
сходство не является совершенно случайным. 


Операторы связывания 


Бинарный оператор =- связывает строковое выражение с поиском по шаблону, 
подстановкой или транслитерацией (вольно называемой трансляцией). Если не 
использовать этот оператор, то поиск или замена осуществляются в строке, содер- 
жащейся в переменной $_ (переменной по умолчанию). Строка, подлежащая свя- 
зыванию, помещается в левую часть, а сам оператор — справа от нее. Возвращае- 
мое значение указывает на успех или неудачу оператора справа. поскольку опера- 
тор связывания, в сущности, никаких самостоятельных действий не выполняет. 
Исключение составляет использование модификатора /г в операции подстановки 
(5///) или транслитерации (у; ',, {г///) – в этом случае возвращается копия изменен- 
ной строки. Поведение в списочном контексте зависит от конкретного оператора. 


Если правый аргумент представляет собой выражение, а не оператор поиска по 
шаблону, замены или транслитерации, то на этапе выполнения это выражение 
будет интерпретироваться как шаблон, по которому должен быть проведен по- 
иск. Например, $_ =- $раї эквивалентно $ =- /$фрат/. Это менее эффективно, чем 
явный поиск, поскольку шаблон должен проверяться и, возможно, перекомпили- 
роваться при каждом вычислении выражения. Избежать повторной компиляции 
можно путем предварительной компиляции исходного шаблона с использовани- 
ем оператора цитирования регулярного выражения, 0г//. 


Бинарный оператор !- аналогичен =-, с тем отличием, что возвращается логическое 
отрицание результата. Использование бинарного оператора !- с модификатором /г 
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для неразрушающей подстановки или транслитерации вызывает синтаксическую 
ошибку. Во всем остальном следующие выражения действуют одинаково: 


$57119 !- /раїтегп/ 
1( $51гіпод =- /раїтегп/ ) 
пос $51гіпо =- /раїтегп/ 


Мы сказали, что возвращаемое значение сигнализирует об успешности операции, 
но есть разные типы успеха. Если не используется модификатор /г для принуди- 
тельного возврата результатов поиска, подстановка возвращает число найденных 
совпадений, как и транслитерация. (На практике оператор транслитерации часто 
применяют для подсчета символов.) Поскольку любой ненулевой результат явля- 
ется истиной, то все работает. Наиболее впечатляющий пример «истинного» зна- 
чения дает присваивание шаблона списку: в списочном контексте поиск по шаб- 
лону может возвращать подстроки, соответствующие круглым скобкам, имею- 
щимся в шаблоне. И снова, согласно правилам присваивания списку, сама опера- 
ция присваивания возвращает истину, если что-либо было найдено и присвоено, 
и ложь в противном случае. Поэтому иногда можно встретить код такого вида: 


і? (пу ($К, $) = $1гіпо =- т/(\м+)=(\м*)/ ) { 
ргіпі “КЛЮЧ $к ЗНАЧЕНИЕ $\\п”; 
} 


Разберем этот пример. Оператор =- имеет больший приоритет, чем =, поэтому сна- 
чала выполняется =-. Оператор =- связывает $5їгіпо с шаблоном в правой части, 
который ищет в строке подстроку, похожую на КЛЮЧ=ЗНАЧЕНИЕ. Этот оператор нахо- 
дится в списочном контексте, поскольку расположен в правой части присваива- 
ния списку. Если поиск успешен, возвращается список, который нужно присво- 
ить $Ки $\, новым переменным, созданным посредством объявления пу. Само при- 
сваивание списку находится в скалярном контексте, поэтому оно возвращает 2 — 
число значений в правой части присваивания. А 2 оказывается истиной, поскольку 
наш скалярный контекст является также логическим. Если соответствия не най- 
дены, значения не присваиваются. и возвращается 0, т.е. ложное значение. 


Подробности о замысловатостях шаблонов читайте в главе 5. 


Мультипликативные операторы 


В Рей имеются операторы * (умножение), / (деление) и % (взятие по модулю), ана- 
логичные операторам языка С. Операторы * и / действуют точно так, как можно 
предположить: перемножают и делят свои операнды. Деление осуществляется 
с вещественной точностью, если не используется прагма 1п1едег, 019111, бідгаї или 
бідпит. Оператор % преобразует свои операнды в целые числа, а затем находит оста- 
ток от деления целых чисел. (Однако при необходимости он осуществляет это де- 
ление с вещественной точностью, поэтому на большинстве 32-разрядных машин 
операнды могут иметь размер до 15 цифр.) Возьмем для примера операнды с име- 
нами $а и $0. В отличие от математической функции вычисления остатка, опера- 
тор % в Ре! определяет пилообразную функцию на множестве действительных 
чисел. На каждом интервале между соседними кратными делителями она снача- 
ла резко возрастает почти до первого из них, а затем плавно падает до 0. Эта функ- 
ция не симметрична относительно начала координат, но сохраняет пилообраз- 
ную форму. Математически $а % $6 можно выразить как: 
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иѕе РОЅІХ; 
фа % $0 == $а - ( РОЅІХ::Ғ1оог($а / $0) * $0 ) 


Если в области видимости имеется директива изе іпіедег, то % предоставляет пря- 
мой доступ к оператору взятия по модулю в том виде, в каком он реализован в ва- 
шем компиляторе С. Этот оператор не вполне корректно определен для отрица- 
тельных операндов, но выполняется быстрее. 


Бинарный оператор х является оператором повторения. Фактически в нем два 
разных оператора. В скалярном контексте он возвращает конкатенированную 
строку, состоящую из левого операнда, повторенного число раз, заданное правым 
операндом. (Для обратной совместимости он делает это и в списочном контексте, 
если левый аргумент не заключен в круглые скобки.) 


рг1пф ‘-’х 80; # выведет строку дефисов 
ргіпЕ "ХЕ" х ($%ар/8), “ " х ($1а6%8); # замена пробелов табуляцией 


В списочном контексте, если левый операнд заключен в круглые скобки или спи- 
сок сформирован, как д\/5ТАТМС/, то х действует как репликатор списка, а не реп- 
ликатор строки. Это удобно для инициализации массива неопределенной длины 
одинаковыми значениями: 


ту @опез = (1) х 80: # список из 80 единиц 
@опез = (5) х @опез, # установить все элементы равными 5 


Аналогично оператор х можно использовать для инициализации срезов массивов 
и хешей: 


ту Унази; 
пу @кеуѕ = дм(рег1з беѓоге 5міпе); 
@һаѕһ{@кеуѕ} = ("") х @кеуѕ; 


Если вам это непонятно, обратите внимание, что оКеуз выступает как список в ле- 
вой части присваивания и как скалярная величина (возвращающая размер мас- 
сива) в правой части присваивания. Предыдущий пример оказывает на %ћаѕћ та- 
кое же воздействие, как: 


фһаѕһ{рег15} =; 
фһаѕћ{беғоге} = “"“; 
фһаѕһ{әміпе) = "": 


Аддитивные операторы 


Как ни странно, в Ре! есть и обычные операторы + (сложение) и - (вычитание). 
Оба оператора при необходимости преобразуют свои аргументы из строк в числа 
и возвращают числовой результат. 


Кроме того, в Рей имеется оператор для конкатенации строк. Например: 
ту $а1тоѕї = “Егед” "Ғ1іпіѕёопе“, # возвращает Ргедғ1іпіѕїопе 


Заметьте, что Регі не помещает между конкатенируемыми строками пробел. Ес- 
ли пробел необходим или нужно конкатенировать более двух строк, можно ис- 
пользовать оператор јоіп, описываемый в главе 27. Чаще всего, однако, конкате- 
нацию выполняют неявным образом, заключая строку в двойные кавычки: 


ту $Ри11пате = "$Ғігѕтпате $1аѕїпате”; 
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Операторы сдвига 


Операторы поразрядного сдвига (< и >) возвращают значение левого аргумента, 
сдвинутое влево (<) или вправо (>>) на число разрядов, заданное правым аргумен- 
том. Аргументы должны быть целыми числами. Например: 


1 << 4; # вернет 16 
32 >> 4; # вернет 2 


Будьте бдительны. Результат применения этих операторов к большим (или отри- 
цательным) числам может зависеть от разрядности вашей машины. Избежать 
этого ограничения можно с помощью прагмы 019111. 


иѕе 5.14; 
зау 500 << 20; # выведет 524288000 
зау 500 << 200; # выведет (только) 128000 


џѕе бідіпї; 
ѕау 500 << 200; 
803469022129495137770981046170581301261101496891396417650688000 


Именованные унарные операторы 
и операторы проверки файлов 


Некоторые из «функций», описываемых в главе 27, являются в действительности 
унарными операторами. В табл. 3.2 перечислены все именованные унарные опе- 
раторы. 


Таблица 3.2. Именованные унарные операторы 


еуа1 ргототуре | з1еер 


-Х (проверка файлов) от1те 


абѕ ехіѕіѕ пех дуотетета | ѕагї 


а]агт ехії іпї гапа ѕгапа 
са11ег ехр кеуѕ геадаіг ѕїаї 
Ссћаіг тс 1с геад1іпе ЗТате 
сһотр ҒіІепс 1СҒігѕї геад1іпк ѕїџду 
спор детс 1еподїћ гваар1ре 1е11 
сг 9е19г919 ]0са1 геғ 1е1191г 
сһгоої детогпат 1оса}їіпе геѕет 1іеа 
с1056 деїћоѕїрупате | 10ск гем1пад1г ис 
с1оѕедіг детпетоупате 109 гтбіг ис г 
с0$ детреегпате 151їаї ѕса1аг итазк 
дбтс10ѕе детрогр пу ѕеїһоѕіепї ипае? 
бе?іпей деїрготорупате | осї ѕзеїпетеп“ ипе 
де1еїе деЕрипат ога ѕеїргоїоепї уа1џеѕ 
00 деїрмџід сиг ѕеїѕегуепі мгіте 
еасһ детзоскпате ЅПіҒЕ любая ($) подпрограмма 


ео? 9106 роѕ 5іп 
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В отличие от списочных операторов, унарные операторы имеют более высокий 
приоритет, чем некоторые бинарные. Например: 


ѕ1еер 4 | 3; 


приостановит выполнение не на 7 секунд, а на 4, а затем возьмет результат выпол- 
нения 51еер (обычно 0), и выполнит операцию поразрядного ИЛИ с числом 3, как 
если бы скобки были расставлены так: 


($1еер 4) | 3; 
Сравните с: 
ргіпі 4 | 3: 


Этот оператор выполняет логическое ИЛИ 4 и 3 (1 в данном случае), перед выво- 
дом, как если бы стояли скобки: 


ргіпі (4 |3), 


Дело в том, что ргіпі представляет собой списочный оператор, а не простой унар- 
ный. Если запомнить, какие операторы являются списочными, будет несложно 
отличить унарный оператор от списочного. Если возникают сомнения, всегда 
можно воспользоваться круглыми скобками, чтобы превратить унарный опера- 
тор в функцию. Помните: что выглядит как функция, функцией и является. 


Еще одно любопытное обстоятельство, связанное с именованными унарными 
операторами, заключается в том, что многие из них по умолчанию работают с пе- 
ременной $ _, если не передать им никакого аргумента. Однако если аргумент опу- 
щен, а лексема, следующая за унарным оператором, похожа на начало аргумен- 
та, Регі придет в замешательство, поскольку ожидает появления терма. Когда 
анализатор лексем Рег встречает один из символов, перечисленных в табл. 3.3, 
то возвращает различные типы лексем в зависимости от того, что он рассчитыва- 
ет получить – терм или оператор. 


Таблица 3.3. Двусмысленные символы 


Символ 
Сложение Унарный плюс 
Вычитание Унарный минус 


Умножение *Туред106 


/ Деление /вабло: 
Меньше, сдвиг влево <НАМОЕЕ>, <<ЕМО 
Конкатенация .3333 

? 2: шаблон? 

% Взятие по модулю %хеш 
&, && &подпрограмма 


Типичная глупая ошибка выглядит так: 


пехі і? 1егсїћ < 80; 


В этом случае < кажется анализатору началом символа ввода <> (термом), а не опе- 
ратором «меньше», который вам нужен. Исправить эту ситуацию в Рег] и одно- 
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временно сохранить его патологическую эклектичность решительно невозмож- 
но. Если вы невероятно ленивы и не можете заставить себя набрать два символа 
конструкции $_, воспользуйтесь одним из следующих способов: 


пехї і? Іепоїһ() < 80; 
пехї і? (1епдїһ) < 80; 
пехї і? 80 > Іепоїћ; 
пех оп1еѕѕ Іепоіћ >= 80, 


Если ожидается терм, то знак «минус», за которым следует одна буква, всегда 
рассматривается как оператор проверки файла. Оператор проверки файла пред- 
ставляет собой унарный оператор, который принимает один аргумент, являю- 
щийся именем файла или его дескриптором, и проверяет, обладает ли этот файл 
некоторым свойством. Если аргумент опущен, оператор проверяет $_. Исключе- 
ние: оператор -ї, который проверяет ЭТОТ. Если в документации не указано иное, 
оператор проверки файла возвращает 1 при выполнении условия и "" при его не- 
выполнении, либо неопределенное значение, если файл не существует или недос- 
тупен по каким-то другим причинам. Реализованные в настоящее время операто- 
ры проверки файлов перечислены в табл. 3.4. 


Таблица 3.4. Операторы проверки файлов 


Оператор | Значение 


-г Файл доступен для чтения текущему пользователю или группе (еЁесііуе ОТО/ 
СІР) 

-м Файл доступен для записи текущему пользователю или группе (еѓѓесііуе ОТр/ 
СІР) 

-х Файл доступен для выполнения текущему пользователю или группе (еЙесйуе 
0Ір/сІр) 

-0 Файл принадлежит текущему пользователю (еЙесйуе ОТО) 

-В Файл доступен для чтения реальному пользователю или группе (геа1 ОТО/СТО) 

-\ Файл доступен для записи реальному пользователю или группе (геа ОТО/СТО) 

-Х Файл доступен для выполнения реальному пользователю или группе (геа 01р/ 
СІЮ) 

-0 Файл принадлежит реальному пользователю (геа! ОТО) 

-е Файл существует 

-2 Файл имеет нулевую длину 

-8 Файл имеет ненулевую длину (возвращает размер) 

-Р Обычный файл 

-0 Каталог 

-1 Файл является символической ссылкой 

-р Файл является именованным каналом (ЕІЕО) 

-5 Файл является сокетом 

-р Специальный файл блочного устройства 

-с Специальный файл символьного устройства 

Е Дескриптор файла связан с терминалом 


-0 Для файла установлен бит ѕеёџіа 
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Таблица 3.4 (продолжение) 


Оператор | Значение 


-6 Для файла установлен бит зеё1а 

-К Для файла установлен «липкий бит» (5ИсКу Ыі) 

т Файл является текстовым 

-В Файл является двоичным (проверка, обратная -Т) 

-М Время, прошедшее с момента последней модификации файла до запуска сце- 
нария, в днях 

-А Время, прошедшее с момента последнего обращения к файлу до запуска сце- 
нария, в днях 

-С Время, прошедшее с момента последнего изменения индексного дескриптора 


до запуска сценария, в днях 


На эти операторы не распространяется правило «если выглядит как функция...», 
описанное выше. То есть наличие открывающей скобки после оператора не влия- 
ет на то, как будут интерпретироваться его аргументы. Это означает, например, 
что выражение -#($#і1е).".рак" эквивалентно выражению -! "$Ғі1е.бак". Чтобы от- 
делить оператор проверки файла от следующего за ним кода, достаточно просто 
заключить его в круглые скобки (разумеется, это необходимо, только если в вы- 
ражении присутствуют операторы, имеющие более высокий приоритет, чем унар- 
ные операторы): 


-$($1711е) + 1024 # возможно, ошибка; то же, что и -5($ѓі1е + 1024) 
(-$ $Е11е) + 1024 # правильно 


Обратите внимание, что -5/а/0/ не производит подстановку с отрицанием. Однако 
-ехр($Роо) работает, как должно: только одиночные буквы после минуса тракту- 
ются как проверка файла. 


Интерпретация операторов прав доступа к файлам ', -В, -и, -И, -х и -Х основы- 
вается исключительно на свойствах файла и идентификаторах пользователя 
и группы. Могут быть и другие причины, по которым не удается читать, записы- 
вать или выполнять файл. Например, в системе применяются списки управле: 
ния доступом (Ассезз СопігоЇ 1.1543, АСГ), и вы не включены в список.! Заметьте 
также, что для суперпользователя -г, -К, -н и -И всегда возвращают 1, а -х и -Х воз- 
вращают 1, если установлен хоть один бит исполнения. Поэтому в сценариях, ра- 
ботающих с полномочиями суперпользователя, может потребоваться выполнить 
ѕїаї, чтобы определить действительный режим файла, либо временно установить 
другой идентификатор пользователя. Остальным операторам проверки файлов 
безразлично, кто вы такой. Проверку того, является ли файл обычным, может 
выполнять любой: 


ме (<>) { 
сћотр; 
пех ип1езз -Р $_; # пропустить “особые ` файлы 


1 Однако можно изменить стандартную семантику с помощью прагмы *і1еїеѕї. См. гла- 


ву 29. 
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Ключи -Т и -В действуют следующим образом. Участок файла примерно в объеме 
первого блока исследуется на наличие необычных символов, таких как коды 
управления или байты с установленным старшим битом (не похожие на ОТЕ-8). 
Если необычных байтов более трети, такой файл считается двоичным, в против- 
ном случае — текстовым. Кроме того, двоичным считается любой файл, в первом 
блоке которого встретился символ АБСП МОГ. (\0). Если -Т или В применяется 
к дескриптору файла, то исследуется не первый блок файла, а текущий буфер вво- 
да (стандартный 1/0 или «ѕ#діо»). Оба оператора, Т и -В, возвращают истину для 
пустого файла или файла, указатель которого находится в ЕОЕ – конце файла, 
если проверяется дескриптор. Поскольку Ре! требуется прочесть файл, чтобы 
выполнить проверку -Т, применение последней со специальными файлами, кото- 
рые могут вызвать зависание или доставить другие неприятности, нежелательно. 
Поэтому чаще всего нужно сначала выполнить проверку с ключом -#, например: 


пехЕ ип1ез$ -Ғ $Ғі1е && -Т $ғ11е; 


Если какой-либо из проверок файлов (или операторам ѕїаї или 151а1) передается 
специальный дескриптор файла, состоящий из одного символа подчеркивания, 
то используется структура ѕѓаѓ от предыдущей проверки файла (или оператора 
ѕтаї), что позволяет избежать нового системного вызова. (Это не действует при на- 
личии директивы и5е Ғі1еїеѕї и для оператора -ї, и нужно помнить, что 15їаї и -1 
оставляют в структуре ѕїаї значения, относящиеся к символической ссылке, а не 
к действительному файлу. Аналогично, -1 _ всегда возвращает «ложь» после 
обычного зіаї.) 


Вот несколько примеров: 


ргіпі "Доступен для обработки. \п” і? -г $а ||] -м _ || -х 


за+($ғі1епате); 

ргіпі "Доступен для чтения\п” 1? -г 
ргіпё “Доступен для записи\п” і? -м 
ргіпі “Исполняемый\п” ЇР -х 
ргіпі “Установлен бит эетиза\п” і? -и 
ргіпЕ “Установлен бит ѕеідід\п” 1? -9 
ргіпі “Установлен бит ѕ+іску\п` 1 -К 
ргіпЕ “Текстовый\п” ЇЁ -Т 
ргіп “Двоичный\п” ЇР -В 


Время существования файла возвращается операторами -М, -А и -С в днях (вклю- 
чая дробную часть суток) с момента последней модификации, обращения или из- 
менения индексного дескриптора до запуска сценария, хранящегося в перемен- 
ной $°Т ($ВАЗЕТТМЕ). Если файл был изменен после начала выполнения сценария, 
возвращается отрицательное время. Отметьте, что значения времени в большин- 
стве случаев (в среднем 86399 из 86400) являются дробными, поэтому проверка 
равенства целому числу без использования функции іпї обычно оказывается бес- 
полезной. Примеры: 


пехї ип1езз -М $111е > .5; # файлы старше 12 часов 
&пемЕ11е 17 -М $#і1е < 0, # файл новее, чем процесс 
&таіјмагпіпо і? іпі(-А) == 90; # обращение к файлу ($_) ровно 90 дней назад 


Чтобы установить время запуска сценария равным текущему времени, достаточ- 
но выполнить: 
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$-Т = ше; 


Начиная с Рей у5.10 синтаксис дополнился удобной возможностью комбиниро- 
вать операторы проверки файлов. В результате конструкция -Г -и -х $Ее равно- 
ценна -х $Ғі1е && -м _ & -Р _. 


Операторы сравнения 


В Ре] имеется два класса операторов сравнения. Один класс выполняет опера- 
ции сравнения со строковыми величинами, другой с числовыми, как показано 
в табл. 3.5. 


Таблица 3.5. Операторы сравнения 


Значение 


Больше 
Больше или равно 
Меньше 
Меныше или равно 


Эти операторы возвращают 1 в качестве истины и "”- как ложь. Заметьте, что 
операторы сравнения неассоциативны, что означает синтаксическую ошибку 
ввыражении Фа < $0 < $с. 


В отсутствие объявлений региональных настроек сравнение строк основывается 
на значениях кодов символов Юникода. Если же такое объявление присутствует, 
используется соответствующая указанным региональным настройкам схема упо- 
рядочения. Устаревшие механизмы сравнения, основанные на региональных на- 
стройках, не всегда хорошо взаимодействуют с механизмами сравнения Юнико- 
да, предоставляемыми модулями Џпісойе::Со11аїе и /п1соде::Со11ате: 1осазе. Поэто- 
му лучше использовать модули, а не региональные настройки. Порядок кодов 
символов не совпадает с алфавитным порядком следования символов, за исклю- 
чением символов АЗСИ, поэтому строковые операторы в Рег! производят резуль- 
таты в алфавитном порядке для символов формата АЗСП, но не для произволь- 
ных текстов вообще. 


Операторы равенства 


Операторы равенства, перечисленные в табл. 3.6, во многом похожи на операторы 
сравнения. 


Таблица 3.6. Операторы равенства 


Значение 
Равно 

Не равно 
Сравнение, результат со знаком 


Интеллектуальное сопоставление 
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Операторы проверки равенства и неравенства возвращают 1 в качестве значения 
«истина» и “ в качестве значения «ложь» (как и операторы сравнения). Операто- 
ры <=> и спр возвращают 1, если левый операнд меньше правого, 0 при их равенст- 
ве, и +1, если левый операнд больше правого. Хотя операторы равенства похожи на 
операторы сравнения, они имеют более низкий приоритет, поэтому запись Фа < $6 
<=> $с < $0 синтаксически допустима. 


По причинам, очевидным для каждого видевшего фильм «Звездные войны», опе- 
ратор <=> называют также оператором «космического корабля» (ѕрасеѕћір). 


Оператор -- описывается в следующем разделе. 


Оператор интеллектуального сопоставления 


Впервые представленный в Рен у5.10.1/ бинарный оператор -- (двойная тильда) 
выполняет «интеллектуальное сопоставление» своих операндов. В большинстве 
случаев он неявно используется в конструкциях ипеп, хотя не все ветви мћеп ис- 
пользуют оператор интеллектуального сопоставления. От других операторов Ре! 
этот оператор отличает его способность к рекурсивному выполнению. 


Другая его особенность в том, что остальные операторы предполагают определен- 
ный контексту (обычно строковой или числовой) для своих операндов и автома- 
тически выполняют преобразование операндов в нужный контекст. Оператор ин- 
теллектуального сопоставления выводит контекст из фактических типов опе- 
рандов и на основе типов выбирает наиболее подходящий механизм сравнения. 


Оператор -- сравнивает свои операнды «полиморфически», выбирая способ срав- 
нения на основе из их фактических типов (число, строка, массив, хеш, и так да- 
лее). Подобно операторам определения равенства, с которыми он совпадает по 
уровню приоритета, оператор -- возвращает 1 в качестве значения «истина» и "" 
в качестве значения «ложь». Как и в операторе связывания =-, правый аргумент 
этого оператора считается шаблоном, которому может соответствовать, либо не 
соответствовать левый аргумент. Однако, понятие «шаблон» здесь используется 
в широком смысле: практически любое значение может играть роль шаблона или 
списка шаблонов. 


Оператор -- часто лучше читать, как «соответствует» или «соответствует любому 
из», потому что левый операнд проверяется на соответствие правому операнду 
(или некоторой части правого операнда). 


Новедение оператора интеллектуального сопоставления зависит от типов аргу- 
ментов, как определено в табл. 3.7. В первой колонке таблицы перечислены типы, 
определяющие поведение оператора интеллектуального сопоставления. Но, по- 
скольку сначала определяется тип правого операнда, и только потом левого, таб- 
лица отсортирована по типу правого операнда. 


Оператор интеллектуального сопоставления автоматически разыменовывает все 
несвязанные ссылки на хеши или массивы, поэтому таким ссылкам соответству- 
ют строки НАЅН и АНРАУ. Связанным ссылкам соответствуют строки 0бјесї. При со- 
поставлении хешей всегда исследуются только ключи, и никогда – значения. 


1 Вверсии у5.10.0 этот оператор действует иначе в некоторых пограничных случаях, но 


в этом нет ничего страшного, потому что сейчас вы используете версию не ниже у5.14, 
правда? 
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Пример в колонке «Аналог» не всегда точно соответствует фактической реализа- 
ции. Например, оператор интеллектуального сопоставления использует укоро- 
ченную схему вычислений везде, где только возможно, а команда дгер – нет. Кро- 
ме того, команда огер в скалярном контексте возвращает количество совпадений, 
а оператор -- возвращает только їгие или ѓа1$е. 


В отличие от большинства операторов, оператор интеллектуального сопоставле- 
ния интерпретирует значение ипе? по-особенному: 


пу @аггау = (1, 2, 3, ипдеф, 4, 5), 
зау "некоторые элементы не определены” і? ипдеГг -- @аггау; 


Каждый операнд исследуется в модифицированном скалярном контексте, в ре- 
зультате такой модификации массивы и хеши передаются оператору по ссылкам, 
которые он, в свою очередь, разыменовывает. Оба элемента в каждой паре суть 
одно и то же: 


пу Жпаѕһ = (геа => 1, 61е => 2, шеей => 3, 
огапде => 4, уе110м => 5, ригр1е => 6, 
БЛаск => 7. дгеу => 8, мһ1їе => 9); 
ту баггау = ам(геа Б1ие огееп), 


ѕау "некоторые элементы массива совпадают с ключами хеша” 1Р @аггау -- Пазий; 
зау "некоторые элементы массива совпадают с ключами хеша” і? \@аггау -- \Жһаѕһ, 


ѕау “цвет геа присутствует в массиве” 1# "гей" -- @аггау; 
зау “цвет гей присутствует в массиве" і? "гед" -- \@аггау; 


ѕау “некоторые ключи оканчиваются на е" 1+ /е$/ -- Фпазп; 
ѕау “некоторые ключи оканчиваются на е” і? /е$/ -- \Жһаѕп 


Таблица 3.7. Поведение оператора интеллектуального сопоставления 


Слева | Справа | Описание | Аналог (но вычисляется 
в логическом контексте) 
Апу ипадеѓ Проверяет, является ли произвольное | !деғіпеа Апу 
значение Апу неопределенным значением 
Апу Објест | Вызывает перегруженную реализацию 
оператора -- в 0бјесї или завершается 
ошибкой 
НАЅН Подпрограмма возвращает {гие для всех | !дгер { !С00Е->($_) } Ккеуѕ НАЗН 
ключей хеша НАЅН 
АВВАУ Подпрограмма возвращает {гие для всех | !сгер { !С00Е->($_) } АВВАУ 
элементов массива АЙААҮ 
Апу Подпрограмма возвращает {гие для Апу | С00Е->(Апу) 
НАЗНТ Оба хеша обладают олним и тем же набо- | кеуѕ НАЗНТ == дгер 
ром ключей { ехіѕїѕ НА$Н2->{$ } } 
Кеуз НАЗНТ 
АВВАУ Хотя бы один из элементов массива АЛВАҮ| дгер { ехіѕїѕ НАЗН->{$_} } АВВАУ 


совпадает с одним из ключей хеша НАЗН 
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Слева | Справа 


Описание 
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Аналог (но вычисляется 
в логическом контексте) 


Ведехр Любой из ключей НАЅН соответствует | огер { /Яедехр/ } Кеуз 
шаблону Аедехр НАЅН 

ипаеғ Всегда ѓа]ѕе (ипде? не может быть ключом) | 0 == 1 

Апу Наличие ключа Алу в хеше НАЗН ехіѕїѕ НАЗН->{Апу} 

НАЗН Хотя бы один из элементов массива АВНАУ| огер { ехіѕїѕ НАЗН->{$_} } ААЛАҮ 
совпадает с одним из ключей хеша БАЗН 

АВВАУ1 Рекурсивно сопоставляет парные эле- | (АННАҮТ[0] -- АВВАУ2[01) 
менты массивов АВРАУ1 и АЯВАУ2Ъ &8 (АВВАҮ1[1] -- АВВАУ21]) 88 

Ведехр Любой элемент массива АВВАУ соответ-| гер { /Аедехр/ } АВВАУ 
ствует шаблону Яедехр 

опаде? Проверяет наличие џпоеѓ в массиве АЯЯАУ | гер { !де?іпеа } АВВАУ 

Апу Выполняется интеллектуальное сопос- | дгер { Алу -- $_ } АВВАУ 
тавление с каждым элементом массива 
АННАУ 

НАЅН |Ведехр | Любой из ключей НАЗН соответствует] гер { /Ведехр/ } Кеуз 
шаблону Аедехр НАЅН 

АВВАУ | Яедехр | Любой элемент массива АВВАУ соответ- | дгер { /Ведехр/ } АНВАУ 
ствует шаблону Аедехр 

АМУ Ведехр |Обычный поиск по шаблону Апу =- /Ведехо/ 

Објес+ | Апу Вызывает перегруженную реализацию 
оператора -- в 06јесї или используется 
сопоставление по умолчанию 

Апу Числовое сравнение Апу == Мит 

Мит Числовое сравнение Апу == питлке 

ипдеѓ Проверяет, является ли произвольное | 'деР1пеб Апу 


значение Апу неопределенным значением 


Строковое сравнение 


А’) ед Ап) 


Пустые хеши и массивы автоматически признаются соответствующими. 

То есть каждый элемент из одного массива сопоставляется с соответствующим элемен- 
том из другого массива с помощью того же оператора интеллектуального сопоставле- 
ния (см. следующую сноску). 
При обнаружении циклической ссылки сопоставление сводится к сравнению ссылок. 


4 Либо число, либо строка, которая выглядит как число. 


Два массива считаются соответствующими, если каждый элемент первого масси- 
ва рекурсивно соответствует (в терминах интеллектуального сопоставления) эле- 
менту второго массива с тем же индексом: 


ту @111е = ди(красный синий зеленый); 
пу ©ріддег = (“красный", “синий”, [ “оранжевый”, “зеленый” ] ) 
1 (@11її1е -- @619дег) { # истина! 

зау “малое содержится в большом“; 


} 
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Поскольку оператор интеллектуального сопоставления при необходимости про- 
изводит рекурсивное сопоставление с вложенными массивами, следующий фраг- 
мент также сообщит, что элемент "красный" присутствует в массиве: 


ту ёаггау = дм(красный синий зеленый); 
ту $пезтей_аггау = [ГЕСС @аггау 11111]; 
ѕау “красный в массиве” і? “красный” -- Фпезтед_аггау; 


Если массивы соответствуют один другому, они являются глубокими копиями 
друг друга, как видно из этого примера: 


ту @а = (0, 1, 2, [3, [4, 5], 6], 7); 
ту ёр = (0. 1, 2, [3. [4. 5], 6], 7); 


іР (@а -- ер 88 @0 -- ба) { 
зау “а и б - глубокие копии друг друга”; 
} 
е151{ (@а -- @р) { 
зау “а присутствует в 6" 
} 
е151ғ (@б -- @а) { 
ѕау "6 присутствует в а”, 
} 
е15е { 
ѕау “а и 0 не соотве:ствуют друг другу” 
} 


Если выполнить эту программу, она выведет: 


аиб - глубокие копии друг друга 


Если выполнить инструкцию $0[3] = 4, тогда пример выведет `0 присутствует в а", 
потому что в соответствующей позиции в массиве ва содержится вложенный мас- 
сив, содержащий (на каком-то уровне) 4. 


Интеллектуальное сопоставление одного хеша с другим позволяет выяснить, со- 
держат ли они одинаковые ключи, ни больше, ни меньше. Этот факт можно ис- 
пользовать, например, чтобы определить наличие полей с одинаковыми именами 
в двух записях, без учета значений этих полей. Например: 


изе м5. 10; 
зиб таке _додїад { 
зтафе $НЕОИТВЕО_ЕТЕГО$ = { пате=>* гапк=>1 Ѕег1аї пим=>1 } 


пу ($с1а55, $іпії #іе105) =@; 


діе “Запись должна содержать (только) название, ранг и серийный номер 
ип1еѕѕ $іпії Ғіе105 -- ФВЕОЏІНЕЮ РІЕІ 05; 


} 


Или, если другие поля допустимы, но не требуются, используйте сопоставление 
АВВАУ -- НАН: 


иѕе 5.10; 
зиб таке додтад { 
зїаїе $АВЕСИТВЕВ РІЕІ05 = { пате=>1, гапк=>1, ѕегіа1 пим=>1 }, 
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пу ($с1а$$, $іпії Ғіе105) =@; 


01е “ Запись должна содержать (минимум) название, ранг и серийный номер 
ип1еѕѕ [Кеуз %{$%іпії Ріе105}) -- ФНЕО0ІВЕРр ҒІЕІ05; 


} 


Интеллектуальное сопоставление чаще всего используется неявно, в операторе 
діуеп/мћеп. См. раздел «Оператор біуеп» в главе 4. 


Интеллектуальное сопоставление объектов 


Чтобы избежать использования базового представления объекта, когда правым 
операндом оператора интеллектуального сопоставления является объект, не пе- 
регружающий оператор --, Регі возбуждает исключение "Ѕпагі паїсһіпо а поп- 
оуег1оадеа орјесї бгеакѕ епсарѕи1аїіоп” (Интеллектуальное сопоставление с объек- 
том, не имеющим перегруженной версии оператора, нарушает принцип инкапсу- 
ляции). Поэтому нет никакого способа проверить наличие чего-либо «в» объекте. 
Следующие выражения недопустимы, если объект не содержит реализацию пе- 
регруженного оператора --: 


Упазн -- $орјест 
42 -- форјесї 
“#геа” -- Фобјесі 


Однако есть возможность изменить способ сопоставления с объектом, реализовав 
перегрузку оператора --. Это позволит расширить обычную семантику оператора. 
Особенности перегрузки оператора -- в объектах описываются в главе 13. 


Объект может выступать левым операндом в интеллектуальном сопоставлении, 
но в этом мало смысла. Правила интеллектуального сопоставления имеют пре- 
имущества перед перегруженным оператором, поэтому, даже если объект в левом 
операнде имеет перегруженную версию оператора --, Ре ее игнорирует. Если лє- 
вый операнд не содержит реализацию перегруженного оператора, происходит 
возврат к числовому или строковому сравнению, в зависимости от того, что вер- 
нет оператор геї. То есть: 


форјесї -- Х 


не вызовет перегруженный метод с аргументом Х. Вместо этого решение будет 
приниматься в соответствии с табл. 8.7. В зависимости от типа операнда Х, пере- 
груженный метод может вызываться или не вызываться. Для простых строк или 
чисел сопоставление сведется к следующему: 


фобзесЕ -- Фпимоег геё($орјест) == Фпитрег 
Фоюјесї -- $51гіпо геР($оојесї) еа $51гіпо 


Например, следующий фрагмент сообщит, что «попахивает модулем ІО»: 


изе ТО: : Напд1е, 
ту $РН = 10: :Напа1е->пем(); 
ТЕ ($8 -- /ЛАЬТО\ЬИ) { 
ѕау “попахивает модулем ТО“, 


} 
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Это объясняется тем, что $ интерпретируется как строка вида "10::Напд1е= 
6108(0х8039е0)", в которой и производится поиск соответствия шаблону. 


Операторы поразрядного действия 


КакивС, в Рег есть поразрядные операторы И, ИЛИ, исключающее ИЛИ (ХОБ) 
и НЕ: &, |, 7 и уже знакомый -. Взяв на себя труд изучить таблицу в начале этой 
главы, читатель мог обнаружить, что поразрядное И имеет более высокий при- 
оритет, чем остальные поразрядные операторы, но мы смошенничали и объеди- 
нили их в нашем изложении. 


Эти операторы по-разному действуют на числа и строки. (Один из немногих слу- 
чаев, когда Рей учитывает разницу между ними.) Если оба операнда – числа (или 
использовались как числа), они преобразуются в целые числа и поразрядная опе- 
рация производится над двумя числами. Эти числа имеют гарантированную дли- 
ну 32 разряда, но на некоторых машинах длина может составлять 64 разряда. 
Дело в том, что существует произвольное ограничение, налагаемое архитектурой 
машины. Преодолеть это ограничение можно с помощью прагмы 019111. 


Если оба операнда суть строки (и не использовались как числа с момента при- 
сваивания им значений), операторы выполняют поразрядные операции над соот- 
ветствующими разрядами двух строк. В этом случае не действует произвольное 
ограничение, поскольку для размера строк произвольного ограничения нет. Если 
одна строка длиннее, считается, что более короткая строка имеет в конце доста- 
точное число нулевых разрядов, чтобы компенсировать разницу. 


Например, если выполнить И над двумя строками: 
“123.45” & "234.56" 

то получится новая строка: 
"020.44" 

Но если выполнить И над строкой и числом: 
7123.45” & 234.56 

то строка сначала преобразуется в число, что дает: 
123.45 & 234.56 

Затем числа преобразуются в целые: 
123 & 234 


и в результате получается 106. Обратите внимание, что все битовые строки истин- 
ны (если только не равны строке "0"). Это значит, что если требуется определить, 
оказался ли какой-то байт ненулевым, то вместо: 


11 ( "гед" & “\х01\х02\х03\х04")} { } 


' Однако не следует использовать этот прием на практике. В будущем такое поведение 
наверняка изменится, чтобы быть ближе к семантике Реп 6, где тип правого аргумен- 
та определяет, как будет вести себя объект слева (как строка или число). Поэтому пока 
просто воздержитесь от выражений с объектами в левой части оператора интеллекту- 
ального сопоставления. 
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нужно записать; 


іР ( ("Ргеа” & "\х01\х02\х03\х04") =- /77\0]/ ) { 


Логические операторы (короткого пути) в стиле С 


Как и в С, в Регі имеются операторы && (логическое И) и || (логическое ИЛИ). 
В Рей также имеется вариант логического оператора || — оператор //, определен- 
ное ИЛИ. Они выполняют вычисления слева направо (при этом && имеет несколь- 
ко больший приоритет, чем || и //), проверяя утверждения на истинность. Эти 
операторы, перечисленные в табл. 3.8, известны как операторы короткого пути, 
поскольку определяют истинность утверждения, вычисляя как можно меньшее 
число операндов. Например, если левый операнд оператора && имеет значение 
«ложь», то правый операнд не вычисляется вообще, поскольку, вне зависимости 
от его значения, результат выражения имеет значение «ложь». 


Таблица 3.8. Логические операторы 


Название Результат 


$а 88 $$ |И фа, если $а - їа1ѕе, иначе – $6 

$а || $$ |ИЛИ фа, если $а — їгџе, иначе — $0 

фа // $6 определенное ИЛИ фа. если $а — определено, иначе – $0 

фа ага $6 | низкоприоритетное И фа, если $а — Ра1зе, иначе — $0 

фа ог $6 |низкоприоритетное ИЛИ фа, если $а — (гие, иначе — $6 

$а хог $6 |низкоприоритетное исключаю- | (гие, если только один операнд, Фа или $0, 


щее ИЛИ имеет значение {гуе, иначе — Га:5е 
Короткий путь не просто экономит время, но часто используется для управления 
порядком вычислений. Например, в программах на Регі часто встречается такая 
идиома: 


ореп(ЕТЬЕ, "<", "некий файл") || О1е невозможно открыть некий_файл: $'\п”; 


В данном случае Регі сначала вычисляет функцию ореп. Если ее значение истинно 
(некий файл был успешно открыт), выполнение функции Піе не является обяза- 
тельным и пропускается. Можно прочесть это буквально; «Открыть некий файл 
или умереты» 


Оператор // удобно использовать с функциями, которые сообщают об ошибке, 
возвращая значение ипдеѓ. Например: 


пу $рій = Ғогк() // діе "Невозможно запустить дочерний процесс. $! "; 
ЇР ($ріа) { 
# здесь продолжает работу родительский процесс 


маі $ріа; 
} е1ѕе { 
# здесь продолжает работу дочерний процесс 


ехії; 
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Его также удобно применять для определения отсутствующих значений в хеше. 
Следующее выражение вернет “ОВЕРАУТ“, если искомый ключ отсутствует в хеше 
или имеет неопределенное значение: 


$уа1ие = $һаѕһ{$Ккеу} // "ОЕҒАШТ”; 


Операторы 88 и || отличаются от имеющихся в С тем, что возвращают не 0 или 1, 
а последнее вычисленное значение. В случае || это приводит к тому приятному 
результату, что можно выбрать первое из ряда скалярных значений, которое ока- 
жется истинным. В результате мы получаем весьма переносимый способ поиска 
домашнего каталога пользователя следующего вида: 


ту Фһоте = ФЕМУ{НОМЕ} 
|| ФЕМУ{1_ОбОІА} 
|| (9е1рми19($<))[7] 
|| 91е “Да ты бездомный! \п"; 


С другой стороны, поскольку левый аргумент всегда вычисляется в скалярном 
контексте, нельзя использовать || при выборе для присваивания одного из двух 
составных объектов: 


ба = @6 || @с, # Получится не то, что нужно, потому что 
ба = зса1аг(@6) || @с; # в действительности будет это. 
ба = @р ? @р : @с; # А это работает прекрасно 


Рей предлагает также операторы с более низким приоритетом, апі и ог, которые 
кому-то кажутся более удобочитаемыми и не требуют использования скобок 
в списочных операторах. Эти операторы также выполняют сокращенные вычис- 
ления. Полный список можно найти в табл. 3.8. 


Оператор диапазона 


Оператор диапазона .. представляет собой, в зависимости от контекста, два раз- 
ных оператора. 


В скалярном контексте .. возвращает логическое значение. Оператор диапазона, 
подобно электронному триггеру, имеет два устойчивых состояния и эмулирует 
оператор диапазона строк (запятая) из ѕед, ашЁ и различных редакторов. Каж 
дый скалярный оператор сохраняет собственное логическое состояние. Оно 
имеет значение «ложь», если левый операнд имеет значение «ложь». Если левый 
операнд имеет значение «истина», оператор диапазона остается истинным, пока 
правый операнд не получит значение «истина», после чего оператор диапазона 
снова получает значение «ложь». Оператор не получит значения «ложь», пока не 
будет вычислен в очередной раз. Он может проверить правый операнд и стать 
ложным в том же вычислении, когда стал истинным (так ведет себя оператор диа- 
пазона аи), но все равно один раз вернет значение «истина». Если вы не хотите, 
чтобы правый операнд проверялся до следующего вычисления (а так действует 
оператор диапазона зе4), нужно вместо двух точек использовать три (...).! Оба опе- 
ратора, и .,не проверяют правый операнд, находясь в состоянии «ложь», и не 
проверяют левый операнд, находясь в состоянии «истина». 


1 Не путайте оператор диапазона ... с инструкцией ..., возбуждающей исключение "г 


ітр1епегїеа" (не реализовано). 
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Возвращаемое значение является либо пустой строкой для значения «ложь», ли- 
бо порядковым номером (начинающимся с 1) для значения «истина». Последова- 
тельный номер сбрасывается для каждого встретившегося диапазона. К послед- 
нему номеру в диапазоне добавляется строка "Е0", которая не влияет на числовое 
значение, но дает значение, в котором можно осуществлять поиск при желании 
исключить конечную точку. Исключить начальную точку можно, дождавшись, 
когда последовательный номер станет больше 1. Если оба операнда скалярного .. 
представляют собой числовые литералы, то операнды неявно сравниваются с пе- 
ременной $,, которая содержит номер строки входного файла! 


Примеры: 


16 (101 200) { ргіпї } # вывести вторую сотню строк 
пех 1іпе 1 1 .. /7$/, # пропустить заголовочные строки сообщения 
5/7/> / 1? /7$/ е0г(), # заключить в кавычки тело сообщения 


В списочном контексте .. возвращает список значений ох левого до правого с ша- 
гом в единицу. Это удобно при записи циклов Тог (1..10) и для выполнения опера- 
ций над срезами массивов: 


Рог (101 .. 200) { ргапе } # выводит 101102... 199200 
ту @Гоо = 9е111$1(); 


@Роо = @ѓоо[0 . $иР00]; # дорогостоящая пустая операция 
@Роо = @ѓоо[ -5 . -1]; # срез из последних 5 элементов 


В текущей реализации, когда оператор диапазона используется в выражении 
цикла /огеасй, временный массив не создается, но в старых версиях Рег можно 
было «спалить» немало памяти, записав такой цикл: 


Рог (1.. 1000 000) { 
# код 
} 


Если левое значение больше правого, возвращается пустои список. (Для созда- 
ния списка с элементами в обратном порядке используется оператор ' эуег$е.) 


Если операнды являются строками, оператор диапазона применяет алгоритм вол- 
шебного автоинкрементирования, обсуждавшийся ранее. Поэтому можно сказать: 


ту @а1рпарет = (“А’ 2% 

и получить все буквы (английского) алфавита, либо: 
ту $һехаідії = (0 .. 9, ^а" Р) С$пит & 15]; 

и получить шестнадцатеричную цифру, либо: 


пу 672 = ("01" "31"); 
ргіпе $22[$тдау]; 


и получить список дат с отбивкой нулями. Можно также сказать: 


пу @сотбоз = (“аа” 77") 


1 Точнее, она содержит количество вызовов оператора геа011пе для данного дескриптора. 
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и получить все комбинации из двух букв нижнего регистра. Однако остерегай- 
тесь таких выражений: 


ту @б1осотбоз = (“‘ааваааа” №222.2220) 


поскольку для них требуется большой объем памяти. Скажем точно, потребуется 
память для записи 8031 810 176 скаляров. Остается надеяться, что в вашем распо- 
ряжении 64-разрядная машина. С терабайтом оперативной памяти. Быстрой па- 
мяти. Возможно, итеративный подход лучше. 


Если значение второго операнда находится за пределами последовательности, ко- 
торую может создать волшебный инкремент, перебор значений в последователь: 
ности продолжается, пока очередное значение не окажется длиннее значения 
в правом операнде. Например, выражение "М" “М” воспроизведет последователь- 
ность "М", "Х”, "У" и "7", а затем остановится, потому что следующий элемент по- 
следовательности, “АА`, окажется длиннее “М”. 


Если значение левого операнда не является частью последовательности, воспроиз- 
водимой волшебным инкрементом (т.е. непустая строка, соответствующая шабло- 
ну /`[а-7А-7]*[0-9]*\7/), оператор вернет только начальное значение. Поэтому 
в следующем фрагменте будет получено только аірћһа: 


иѕе сһагпатеѕ “дгеек”; 
ту @дгееК_зта11 = (“\№а1рһа}” \№отеда}”); 


Чтобы получить буквы греческого алфавита в нижнем регистре, можно восполь- 
зоваться следующим приемом: 


и5е сһагпатеѕ “угеек”; 
ту @дгеек_зта11 = тар { сһг } ( 
ога ( "\\№Ка1рна;") .. ога("\№отеда)") 
); 


Однако при этом будут отобраны лишние буквы, потому что между буквами «ро» 
и «тау» следуют две разные буквы «сигма» нижнего регистра — кроме основного 
имеется дополнительный символ `\№{?*- 71а: ѕ:ста). В общем случае числовой по- 
рядок следования кодов символов редко совпадает с алфавитным порядком сле- 
дования символов. Подробности читайте в разделе «Сравнение и сортировка тек- 
ста Юникода» в главе 6. 


Условный оператор 


Как ивязыке С, 7: является единственным тернарным оператором. Его часто на- 
зывают условным оператором, поскольку он работает во многом так же, как кон- 
струкция іѓ-ћеп-е15е, за исключением того, что, поскольку это выражение, а не 
команда, его можно безопасно встраивать в другие выражения и вызовы функ- 
ций. Так как это тернарный оператор, две его части разделяют три выражения: 


СОМО ? ТНЕМ ЕЕ 


Если условие С0№ истинно, вычисляется только выражение ТНЕМ, значение кото- 
рого становится значением выражения в целом. В противном случае вычисляет- 
ся только выражение Е! 5Е, значение которого становится значением выражения 
в целом. 
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Скалярный или списочный контекст распространяется далее на второй или тре- 
тий аргумент в зависимости от того, который из вих выбран. (Первый аргумент 
всегда находится в скалярном контексте, поскольку этот оператор является ус- 
ловным.) 


пу Фа = $0к ? $6 : $с; # получить скаляр 
пу @а = $ок ? @6 . @с; # получить массив 
ту $а = $ок ? 66 : @с; # получить счетчик числа элементов массива 


Условный оператор часто внедряют в список значений для форматирования по- 
средством ргіпі?, поскольку никому не хочется повторять целый оператор ради 
того, чтобы переключиться между двумя связанными значениями. 


ргіпі? “І паме %0 сате1%5$. \п” 
$п, $п ==17 "" №75": 


Удобно, что приоритет ?· выше, чем у запятой, но ниже, чем у большинства опера- 
торов, используемых внутри выражения (== в данном примере), поэтому обычно 
не приходится расставлять скобки. Но для ясности можно, при желании, доба- 
вить и скобки. Для условных операторов, вложенных в части ТНЕМ других услов- 
ных операторов, мы предлагаем использование перевода строки и отступа, как 
если бы это были обычные операторы 11: 


$1еаруеаг = 
фуеаг % 4 == 
? фуеаг % 100 == 0 
? $уеаг % 400 == 
71 
: 0 


: 0; 


Для условных операторов, вложенных в части ЕЁ5Е предшествующих условных 
операторов, можно сделать аналогичную вещь: 


$1еаруеаг = 
фуеаг % 4 
70 
: $уеаг % 100 
71 
: Фуеаг % 400 
70 


я 


но, как правило, лучше выстроить все части С0№ и ТНЕМ вертикально: 


$1еаруеаг = 
фуеаг %4?0 
фуеаг % 10071 
фуеаг % 40070: 1; 


Выравнивание вопросительных знаков и двоеточий способно прояснить даже до- 
вольно запутанные конструкции: 


ргіпЕ? “Да, мне нравится моя %$ книга!\п”, 
$118п ед "Ргепсћ" ? "сһапеаи" 
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$118п ед “дегтап ? “Кате!” 
$118п ед “јарапеѕе" ? “\х{99Е1}\х{9900}”: 
“сате1” 


При использовании прагмы иї#8 символы Юникода можно даже не экраниро- 
вать: 


иѕе ив; 
ргіпЕҒ “Да, мне нравится моя %$ книга! ҷп”, 
$118п ед “РГгепсп” ? "спатеаи” * 
$118п ед “дегтап” ? "Кате! ^ 
$1181 ед “]арапезе” ? “ВЕБЕ” 
“сате1” 


Можно осуществлять присваивание условному оператору, если второй и третий 
аргументы могут выступать в качестве 1-значений (т.е. допустимо осуществлять 
присваивание им) и оба являются либо скалярами, либо списками (в противном 
случае Реп не будет знать, какой контекст предоставить правой части присваива- 
ния): 


(Фа_огь ? $а $5) = $с; # либо $а, либо $6 получает значение $с 


Имейте в виду, что условный оператор связывает аргументы сильнее, чем различ- 
ные операторы присваивания. Обычно это и требуется (взгляните, например, на 
вышеприведенные присваивания $1еаруєаг), но изменить это без применения ско- 
бок нельзя. Присваивание без скобок может привести к неприятностям, и при 
этом может не возникнуть ошибка синтаксического анализа, поскольку анализа- 
тор Рег] может счесть условный оператор за левое значение. Например, можно 
написать так: 


$а% 2 ? $а += 10 $а += 2 # НЕВЕРНО 


Но это будет интерпретироваться так: 


(($а % 2) ? (фа += 10) : $а) += 2 


Операторы присваивания 


Рег признает операторы присваивания С, добавляя к ним некоторые собствен- 
ные. Их много: 


= жа += ъ= 8= <<= &&= 
-= /= |= >>= [|= 
.= %= = 


х= 


Каждый такой оператор ожидает в качестве цели получить 1-значение (обычно 
переменную или элемент массива) в левой части и выражение в правой части. 
Для простого оператора присваивания: 


ЦЕЛЬ = ВЫРАЖЕНИЕ 


1 Удобочитаемость вашей программы это вряд ли повысит, но зато можно сделать весо- 
мую заявку на победу в конкурсе на самый непонятный (ођѓиѕсаќѓед) код на Рег]. 
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значение ЕХРА запоминается в переменной или по адресу, указанному в ТАЯСЕТ. Для 
других операторов Рег! вычисляет выражение: 


ЦЕЛЬ ОП= ВЫРАЖЕНИЕ 
как если бы оно было записано: 
ЦЕЛЬ = ЦЕЛЬ ОП ВЫРАЖЕНИЕ 


Это удобное умозрительное правило, но оно порождает некоторые заблуждения. 
Во-первых, все операторы присваивания всегда имеют приоритет обычного при- 
сваивания, независимо от приоритета, который операция 01 имела бь: отдельно. 
Во-вторых, ЦЕЛЬ вычисляется только один раз. Обычно это не имеет значения, ес- 
ли нет побочных эффектов, таких как автоинкрементирование: 


$\аг[$а++] += $уа1ше, # $а инкрементируется один раз 
$уаг[$а++] = $уаг[$а++] + $уа1ше; # $а инкрементируется два раза 


В отличие от присваивания в С, оператор присваивания в Ре!| возвращает работо- 
способное 1-значение. Модификация присваивания аналогична выполнению при- 
сваивания с последующей модификацией переменной, которой было присвоено 
значение. Это удобно при модификации копии чего-либо, например: 


($1тр = $0106а1) += $сопзфапт; 
что эквивалентно: 

ттр = $010ра1 + Фсопзтапт; 
Аналогично: 

(Фа += 2) *= 3; 
эквивалентно: 


$а += 2; 
$а *= 3; 


Это не Бог весть как удобно, но вот идиома, которая встречается часто: 
(ту $пем = $019) =- 5/Ғоо/баг/0; 


В Рег] у5.14 и более поздних версий ее можно записывать таким же образом, но 
с применением модификатора /г, что приводит к возврату копии измененной вер- 
сии переменной, а не переменной, с которой осуществляет связывание оператор =-. 


ту Флем 
ту $пем 


($019 =- ѕ/ғоо/раг/9ғ); 
$014 =- $/+оо/ваг/дг- 


Во всех случаях значением оператора присваивания является новое значение пе- 
ременной. Поскольку операторы присваивания ассоциативны справа налево, это 
можно использовать для присваивания нескольким переменным одного и того же 
значения: 


$а = $6 = $с = 0: 


При этом 0 присваивается $с, результат этого действия (по-прежнему 0) присваи- 
вается $6, а результат этого действия (по-прежнему 0) присваивается $а. 
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Присваивание списку может выполняться только простым оператором присваи- 
вания =. В списочном контексте присваивание списку возвращает список новых 
значений – так же, как это делает скалярное присваивание. В скалярном контек- 
сте присваивание списку возвращает число значений, имевшихся в правой части 
присваивания, как отмечалось в главе 2. Благодаря этому такое присваивание 
удобно использовать для проверки значений функций, возвращающих пустой 
список, когда их вызов оказывается безуспешным (или перестает быть успеш- 
ным), например: 


ми ]е (($кеу, $уа1ие) = еасп %№91055) { .. } 


пех ип1езз ($9еу, $іпо. $тоде) = ѕїаї $Е11е; 


Оператор запятой 


Бинарный оператор, является оператором запятой. В скалярном контексте он вы- 
числяет свой левый аргумент в пустом контексте, отбрасывает полученное значе- 
ние, затем вычисляет свой правый аргумент в скалярном контексте и возвращает 
полученное значение. Это действие вполне идентично действию оператора запя- 
той в С. Например: 


$а = (1, 3); 


присваивает $а значение 3. Не следует путать использование этого оператора 
в скалярном и списочном контекстах. В списочном контексте запятая служит 
просто разделителем аргументов и вставляет оба свои аргумента в 1157. Никакие 
значения она не отбрасывает. 


Например, если изменить предыдущий пример следующим образом: 
ва = (1. 3): 

то будет создан список из двух элементов, а 
афап2(1, 3), 


является вызовом функции а{тап2 с двумя аргументами. 


Диграф => служит в основном синонимом оператора запятой. Он удобен при запи- 
си аргументов, которые задаются парами. Кроме того, он заставляет интерпрети- 
ровать любой идентификатор, находящийся непосредственно слева от него, как 
строку. Такое автоматическое цитирование работает только для идентификато- 
ров и не работает для числовых литералов. 


Списочные операторы (вправо) 


Правая часть списочного оператора управляет всеми аргументами списочного опе- 
ратора, которые разделяются запятыми, поэтому приоритет списочного оператора 
ниже, чем запятой, если смотреть в правую сторону. Когда списочный оператор 
начинает перемалывать аргументы, разделяемые запятыми, остановить его мо- 
гут только лексемы, завершающие целое выражение (например, точка с запятой 
или модификатор команды), либо лексемы, завершающие текущее подвыражение 
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(например, правая круглая или квадратная скобка), либо логические операторы 
с низким приоритетом, о которых мы и поговорим в следующем разделе. 


Логические апа, ог, пої и хог 


В качестве альтернативы операторам &&, || и! РегІ предоставляет операторы апо, 
ог и пот, имеющие низкий приоритет. Принцип действия этих операторов попарно 
идентичен; в частности, апд и ог вычисляются по короткой схеме, как и их анало- 
ги, что делает их полезными не только в логических выражениях, но и для управ- 
ления логикой программы. 


Поскольку приоритет этих операторов значительно ниже, чем у заимствованных 
из С, их можно безопасно использовать после списочных операторов без всяких 
скобок: 


оп] пк “а1рва”, “Бета”, "датта" 
ог дгіре(), пехЕ ІШІМЕ; 


Применяя операторы в стиле С, следовало бы написать нечто вроде: 


ил1іпк("аә1рһа", "бета", "датта" ) 
|| (9гіре(), пехі ЕТМЕ); 


Но нельзя просто взять и заменить все вхождения || на ог. Допустим, что команду 
фху2 = $х 11 $у || $7; 

мы заменим такой: 
$хуг = $х ог $у ог $2; # НЕВЕРНО 


Она сделает совсем другое! Приоритет присваивания выше, чем приоритет ог, но 
ниже, чем приоритет ||, поэтому сначала переменная $х будет присвоена перемен- 
ной $хуг, а затем выполнены ог. Чтобы получить такой же результат, как с ис- 
пользованием ||, нужно написать: 


фхух = ( $х ог $у ог $2 ); 


Мораль истории такова: выучить приоритеты (или использовать скобки) придет- 
ся вне зависимости от того, с какими логическими операторами вы работаете. Мы 
предлагаем использовать круглые скобки в любых конструкциях, которые могут 
вызывать сомнения у других, даже если они не вызывают сомнений у вас.’ 


Существует также логический оператор хог, не имеющий точного аналога в С или 
Рен, поскольку единственный предоставляемый ими оператор исключающего 
ИЛИ (°) действует поразрядно. Оператор хог не может вычисляться по короткой 
схеме, поскольку всегда необходимо вычислить операнды с обеих сторон. Луч- 
шим эквивалентом для $а хог $6 является, вероятно, !$а != !$0. Конечно, можно 
написать !$а ^ !$0 или даже $а ? !$6 : !1$5. Суть в том, что $а и $6 должны быть 
вычислены как {гие или Ға15е в логическом контексте, а имеющийся поразряд- 
ный оператор не предоставляет его без дополнительных усилий. 


1 Если только вы не собираетесь заставить других выучить приоритеты операторов, 


в чем мы можем вас только поддержать. 
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Операторы С, отсутствующие в Рей 


Вот что есть в С и чего нет в Рег|: 
унарный & 
Оператор взятия адреса. Однако оператор \ в Ре! (для получения ссылки) за- 
нимает ту же экологическую нишу: 
Фге? то маг = \$уаг; 


Но ссылки Регі значительно безопаснее, чем указатели С. 
унарный * 

Оператор разыменования адреса. Поскольку в Ре! нет адресов, нет нужды 
и в их разыменовании. Однако ссылки в нем есть, поэтому символы префик- 
сов переменных Регі служат как операторы разыменования, а также указыва- 
ют на тип: $, ©, % и &. Несколько странно, что фактически имеется оператор 
разыменования *, но поскольку *· является разыменовывающим префиксом, 
обозначающим їуреғ1оБ, он используется иначе. 


(ТИП) 
Оператор приведения типа. Какому типу захочется, чтобы его приводили? 


Операторы и объявления 


Программа на Рей состоит из последовательности объявлений (4ес]агаНопз) и опе- 
раторов (віаќетепёѕ). Объявление может находиться в любом месте, где допускает- 
ся оператор, но основную роль оно играет на этапе компиляции программы. Неко- 
торые объявления несут двойную нагрузку и выполняют также роль обычных 
операторов, но в большинстве своем совершенно прозрачны на этапе выполнения. 
После компиляции главная последовательность операторов выполняется только 
один раз. 

В этой главе объявления рассматриваются после операторов, так что нам хоте- 
лось бы упомянуть о наиболее важных объявлениях прямо сейчас. 


В отличие от большинства языков программирования, по умолчанию Реп не тре- 
бует явного объявления переменных. Они начинают существовать при первом об- 
ращении к ним, независимо от того, были они объявлены или нет. Но при желании 
можно объявить переменные заранее, с помощью объявлений "у, гж и ѕїаїе, пред- 
шествующих именам переменных, благодаря чему компилятор, встретив позже 
имя этой переменной, будет уверен, что оно не содержит опечаток. 


По умолчанию, при попытке обратиться к переменной, которой ни разу не при- 
сваивалось значение, считается, что переменная хранит нулевое значение (если 
используется как число) или ‘- пустую строку (если используется как строка), 
или же получает значение «ложь» при обращении к ней как к логической пере- 
менной. Если программист хочет получать предупреждения об использовании 
неопределенных значений, как если бы они действительно были строками или 
числами, или даже рассматривать такие действия как ошибку, об этом позабо- 
тится объявление изе магп1пд$. 


Аналогично с помощью объявления изе ѕїгісї можно потребовать от самого себя 
объявлять все переменные заранее. В этом случае обращение к необъявленным 
переменным будет считаться синтаксической ошибкой. (Чтобы включить строгий 
режим, достаточно также добавить объявление изе \5.12 или выше, но мы реко- 
мендуем изе \5.14, чтобы все примеры в этой книге компилировались и выполня- 
лись без проблем.) Подробнее об этих объявлениях рассказывается ближе к кон- 
цу этой главы, в разделе «Прагмы». 
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Простые операторы 


Простой оператор — это выражение, вычисляемое ради егс побочных эффектов. 
Каждый простой оператор должен заканчиваться точкой с запятой, если он не 
является последним оператором в блоке. В последнем случае точка с запятой не 
обязательна – Рег понимает, что оператор завершен, поскольку закончился блок. 
Однако в конце блока из нескольких строк точку с запятой лучше поставить, по- 
скольку потом, возможно, будет добавлена еще одна строка. 


Операторы вроде ема1 {}, йо {} и ѕир {} выглядят как составные операторы, но в дей- 
ствительности таковыми не являются. Верно, внутри них допускается наличие 
нескольких операторов, но это не в счет. Внешне эти операторы являются просто 
термами в выражении, и потому требуют явного использования точки с запятой, 
если используются как последний элемент оператора. 


За любым простым оператором может следовать один необязательный модифика- 
тор, как раз перед завершающей точкой с запятой (или окончанием блока). До- 
пускаются следующие модификаторы: 


14 ЕХРВ 
и1]е$$ ЕХРН 
мһі1е ЕХРВ 
01111 ЕХРВ 
Ғогеасһ Е15Т 


Модификаторы 1# (если) и ип1езз (если только не) действуют весьма схожим с обыч- 
ным языком образом: 


$1газћ->Таке( "оиї”) і? $уоџ Іоуе пе; 
ѕһитир() ип1еѕѕ Фуои мапі пе їо 1еаме; 


Модификаторы мһі1е и ипї11 вычисляются многократно. Модификатор ип1]е обес: 
печивает повторное выполнение, пока его выражение остается истинным. а моди: 
фикатор ип{11 обеспечивает повторное выполнение, пока его выражение остается 
ложным: 


фехргеѕѕіоп++ мп11е -е "%#11е$ехргеѕѕ1оп 
К1$$(‘те’) ипїіі1 $1 91е; 


Модификатор Гог (можете также использовать вариант написания ѓогеасћ, если 
вам не жалко свою клавиатуру) выполняет одно вычисление для каждого элемен- 
та в его списке [15Т, при этом $ служит псевдонимом текущего элемента: 


ѕ/јауа/рег1/ Рог @геѕитеѕ; 
зау "поле: $_” Ғогеасћ зр1ії /:/ $даїа11пе; 


Модификаторы мһі1є и џпіі1 имеют обычную семантику цикла мћі1е (сначала вы- 
числяется условие), за исключением применения к блоку 00 (глава 27), когда блок 
один раз выполняется перед тем, как вычисляется условие. Благодаря этому мож- 
но писать такие циклы: 


до { 
$1іпе = <570ІМ>; 


} ипсі1 $1іпе ед ”.\п”; 
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Обратите также внимание, что операции управления циклом, описываемые ни- 
же, в этой конструкции не будут работать, поскольку модификаторы не принима- 
ют метки циклов. Всегда можно заключить конструкцию в дополнительный блок 
для досрочного завершения или же поместить дополнительный блок внутри нее 
для досрочной итерации, как описано ниже, в разделе «Голые блоки в роли цик- 
лов». Либо сконструировать настоящий цикл, содержащий несколько операций 
управления. 


Модификатор ипеп – экспериментальная функция, доступная только при нали- 
чии объявления и5е \5.14 (или выше). Семантика сопоставления этого модифика- 
тора совпадает с семантикой оператора мПеп, поэтому за дополнительной информа- 
цией обращайтесь к разделу «Оператор и модификатор мВеп» ниже в этой главе. 


Составные операторы 


Последовательность операторов в определенной области видимости! называется 
блоком. Иногда областью видимости является весь файл, например, файл, загру- 
жаемый директивой гедиіге, или файл, содержащий основной текст программы. 
Иногда областью видимости является строка, вычисляемая через еуа1. Но обычно 
блок — это то, что заключено в фигурные скобки ({}). Под областью видимости под- 
разумевается любой из этих трех вариантов. Когда же речь идет о блоке в фигур- 
ных скобках, применяется термин «блок» (ВІ0СК). 


Составные операторы образуются из выражений и блоков (В10СК). Выражения со- 
стоят из термов и операторов. В наших синтаксических описаниях словом ЕХРА мы 
будем обозначать место, где можно использовать любое скалярное выражение. 
Для обозначения выражения, вычисляемого в списочном контексте, будем гово- 
рить [15Т. 


Следующие конструкции можно применять для управления условным и много- 
кратным выполнением блоков ВЕОСК. (Часть [АВЕ является необязательной.) 


1+ (ЕХРА) ВОСК 

1Ғ (ЕХРА) ВІОСК е15е ВОСК 

1Ғ (ЕХРВ) ВІОСК е151# (ЕХРЕ» ВОСК 

іҒ (ЕХРВ) ВОСК е151Ғ (ЕХРА) Ві ОСК е1ѕе ВОСК 


ип1еѕѕ (ЕХРА) ВіОСК 

ип1е55 (ЕХРА) ВОСК е15е ВОСК 

ип1еѕ5 (ЕХРА) ВОСК е151Ғ (ЕХРВ) ВОСК .. 

ип1ез$ (ЕХРВ) ВІОСК е151# (ЕХРВ) ВІОСК ... е1зе ВІОСК 


дімеп (ЕХРВ) ВОСК 


САВЕ мћіЈе (ЕХРВ) ВОСК 
АВЕ! мһі1е (ЕХРВА) ВОСК соптапие ВОСК 


ТАВЕЕ ипсі1 (ЕХРА) ВІОСК 
ГАВЕЕ ипїіі1 (ЕХРВ) ВОСК соп1пие ВОСК 


АВЕ! Рог (ЕХРВ; ЕХРВ; ЕХРВ) ВОСК 
ТАВЕЕ Тогеасй (157) ВІОСК 


Области видимости и пространства имен описаны в разделе «Имена» главы 2. 
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ТАВЕЕ Фогеасй МАВ (1157) ВЕОСК 
АВЕ! Ғогеасһ МАН (1Т$Т) ВОСК сопїт1пие ВЕОСК 


ТАВЕС ВЕОСК 
ТАВЕЕ ВЕОСК сопф1пие ВЕОСК 


Обратите внимание на то, что, в отличие от С и Јауа, эти конструкции определены 
в терминах блоков, а не операторов. Это означает, что фигурные скобки необходи- 
мы - присутствие автономных операторов не допускается. Условный оператор без 
фигурных скобок можно записать несколькими способами. Все следующие ко- 
манды делают одно и то же: 


ип1еѕѕ (ореп(Е00, ‘<’, $Ғоо)) { 91е “Невозможно открыть $Роо $!” } 
і? (! ореп(Е00, ‘<’, $Р00)) { Піе “Невозможно открыть $Роо. $!“ } 


діе “Невозможно открыть $Роо: $!’ ип1еѕѕ ореп(Ғ00, ‘<, $00); 
іе “Невозможно открыть $Роо. $!' 1Ғ !ореп(Е00, ‘<’ $600); 
ореп(Е00, "<", $00) || @1е "Невозможно открыть $00: $! "; 


ореп(Е00, <, $100) ог діе “Невозможно открыть $Роо: $!" 


В большинстве случаев мы предпочитаем последнюю пару. Они визуально не 
столь перегружены, как остальные, особенно вариант ог біе. В форме с операто- 
ром !| приходится дисциплинированно расставлять скобки, но в версии ог о них 
можно и позабыть. 


Но главное, почему нам более симпатичны последние два варианта: в них самая 
важная часть оператора располагается в начале строки – на виду у читателя. Об- 
работка ошибки отходит в сторону, так что можно не обращать на нее внимания, 
пока в этом не возникнет необходимость.! Если каждый раз табулировать все про- 
верки ог 41е таким образом, чтобы они начинались в одной и той же колонке спра- 
ва, чтение станет еще более удобным: 


спа1г $01г ог дле “Смена каталога $а1г: $!" 
ореп(Е00, ‘<’, %ғі1е) ог діе “Открытие $?і1е: $! "; 
@11пе$ = <Р00> ог 91е “Ее пуст?"; 

с10ѕе(ғ00) ог 91е “Закрыгие $#11е: $! "; 


Операторы НЙ и ипіеѕѕ 


Оператор ії прост. Поскольку блоки всегда заключены в фигурные скобки, неод- 
нозначности в отношении того, к которому 11 относится тот или иной оператор 
е1ѕе или е1$1, не возникает. Из каждой данной последовательности блоков 11/ 
е1$17/е1зе выполняется только тот первый, значение условия которого истинно. 
Если ни одно условие не является истинным, выполняется блок е15е, если он име- 
ется. Обычно полезно поместить е1зе в конце цепочки 6151? на случай, если вы 
забыли обработать один из вариантов. 


Если вместо і? используется ип1е5$, смысл проверки условия становится противо- 
положным. Таким образом: 


ип1ез$ ($х == 1) 


равносильно: 


1 (Как в этой сноске.) 
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1? ($х != 1) 
или даже неприглядному: 
Р (!($х == 1)) . 


Область видимости переменной, объявленной в управляющем условии, прости- 
рается от места ее объявления и до конца условного оператора, включая все блоки 
6151? и завершающую ветвь е15е, если они имеются, но не далее того: 


1Ғ ((ту Фсо1ог = <5ТрІМ№) =- /гед/і) { 
$уа1ие = 0хғғО000; 

} 

е15іҒ ($со1ог =- /дгееп/1) { 
$уа1ие = 0х001100; 

} 

е151? ($со1ог =- /61ие/1) { 
фуа1ие = 0х0000+Е; 

} 

ә1ѕе { 
сһотр $со1ог; 
магп “неизвестная составляющая ВСВ `$со10г’, использован черный\п” 
фуа1ие = 0х000000: 

} 


По завершении блока е1зе переменная $с010г больше не видима. Если нужно уве- 
личить область видимости, объявите переменную до условного оператора. 


Оператор дімеп 


В предыдущем примере речь шла о цвете. Лингвисты называют это темой. В Ре] 
у5.10 появился оператор дімеп, представляющий альтернативу конструкциям из 
операторов і. Если говорить языком лингвистики, оператор 91\еп определяет те- 
му, устанавливая ее в переменной $_. После этого можно использовать операторы 
мһеп для проверки соответствия темы различным значениям или шаблонам. 


Эта особенность доступна при использовании версии Регі не ниже %5.10: 
и$е м5. 12, Е не ниже у5.12, загрузить особенности с умо"чанию 

А также, если явно включена поддержка «5% Кс»: 
иѕе Геафиге "ѕиіїсһ" # включить поддержку зи1Тсп 


Любая из этих инструкций добавляет в Ре! ряд новых ключевых слов: д1л\уеп, мћеп, 
огеак, сопііпие и деғаџ1ї. Ниже представлен один из способов реализации преды- 
дущего примера с применением новых возможностей: 


изе у5. 10; 

ту $уа1ие; 

дімеп (<5ТрІМ) { 
мһеп (/гед/1) { Фуа1џе = ОхҒЕ0000 } 
мһеп (/огееп/і) { $уа1ие = 0х00РРОО } 
мһеп (/51ие/1) { $уа1ие = 0х0000ЕЕ, } 


деғац1ї { 
сћотр; 
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магп ‘неизвестная составляющая НбВ $, использован черный\п” 
$уа1ие = 0х000000; 


} 


Версия %5.10, по сути, вынуждала написать именно так, потому что 91у\еп в этой 
версии не позволяет возвращать значения. Начиная с версии у5.14 появилась воз- 
можность возвращать значения, и теперь, применив модификаторы оператора 
мпеп, наш пример можно записать так: 


иѕе м5. 14; 


пу $уа1џе = до { 
дімеп (<5Т0ІМ) { 
0хЕРО000 мћеп /гед/1; 
ОхО0ЕЕ00 мћеп /дгееп/1; 
Ох0000ЕЕ мнеп /010е/і1; 
спотр; 
магп “неизвестная составляющая ВСВ `$. использован черный\п” 
0х000000; 


у: 


Аргументы передаются операторам діхеп и мпеп в скалярном контексте. Оператор 
діуеп связывает свой аргумент с переменной $_, устанавливая тему для своего бло- 
ка. Оператор мпеп на основе типа своего аргумента определяет разновидность сопо- 
ставления с шаблоном. Семантика оператора ипеп является надмножеством семан 
тики интеллектуального сопоставления. Если аргумент выглядит, как логическое 
выражение, он вычисляется непосредственно. В противном случае он передается 
оператору интеллектуального сопоставления для последующей интерпретации 
в виде $ -- ЕХРА. Это может показаться сложным, но в действительности это нє 
так, потому что в большинстве своем инструкции выбора имеют вид: 


ие у5.14, 
пу $п = эотеРипс(); 


дімеп ($п) { 

мһеп (0) { ѕау “ноль” } 

мһеп (1) { зау “один } 

мпеп ([3..7]) { ѕау “несколько” } 

мпеп (/^\9+$/) { зау “много” } 
деғаџ1ї { зау “непонятно” } 
} 


Иными словами, операторам ипеп обычно передаются аргументы, вызывающие 
интеллектуальное сопоставление. 


Ниже приводится более длинный пример оператора діхеп: 
изе Ғеатиге ":5. 10"; 
дімеп ($п) { 


# соответствует: 1? ! деғ1пед($п) 
мћеп (ипде?) { 
зау `$п имеет неопределенное значение’; 
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} 


# соответствует: і? $п ед “Роб” 
мнеп (“Роо”) { 
зау `$п - строка Ёоо" `; 


} 


# соответствует: і? $п -- [1.3,5,7,9] 
мһеп ([1,3,5,7,9]) { 
ѕау `$п - нечетная цифра, 
соптсіпџе; # продолжить сопоставление! ! 


} 


# соответствует ` 11 $п < 100 
мћеп ($ < 100) { 
Ѕау '$и меньше 100 в числовом контексте: 


} 


# соответствует: і? сотр1ісатеа сһеск($п) 
мһеп (\&сотріісаед сһеск) { 
ѕау ‘сложная проверка $п дает истину’, 


} 


== 


когда не соответствует ни одному другому случаю 
деғаџо1ї { 
біе а(Невозможно определить, что делать с $п); 


} 


Оператор д1\уеп(ЕХРА) присваивает значение выражения ЕХРЁ копии $_ в лексиче- 
ской области видимости, а не псевдониму в динамической области, как это делает 
оператор Гогеаси в отсутствие объявления пу. Это делает его похожим на блок 00: 


до { му $_ = ЕХРА; } 


за исключением того, что в случае успеха мћеп (или явный оператор бгеак) знает, 
как выйти за пределы блока. Поскольку оператор 91\еп образует лексическую об- 
ласть видимости, его нельзя использовать для локализации динамического зна: 
чения $_, как это позволяет делать Гогеасй старого образца! 


Ключевое слово бгеак можно использовать для выхода за пределы охватывающе- 
го блока діуеп. Каждый блок мһеп неявно завершается ключевым словом огеак. 


Выйти из блока мпеп и перейти к началу следующей инструкции, которая может 
быть, а может не быть другим оператором „теп, можно с помощью ключевого сло- 
ва сопїіпџе: 


оімеп(фҒоо) { 
мһеп (/х/) { зау $00 содержит х ; сопїл1пие } 
зау "Эта строка выводится всегда. ` ; 
мһеп (/у/) { ѕау $#Ғоо содержит у } 
беғаш { ѕау $00 не содержит у } 


Этот недостаток скорее следует рассматривать как особенность, так как использование 
$ с динамической областью видимости чревато ошибками, поскольку в этом случае 
мы получаем два различных фрагмента кода, конкурирующих за текущую тему. 
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Когда оператор діуеп является также допустимым выражением (например, когда 
он является последней инструкцией в блоке), он возвращает: 


пустой список, как только в коде встретился явный оператор огеак; 


» значение последнего вычисленного выражения выполнившейся ветви мпеп/ 
деғҒаи1т, если таковая имеется; 


» значение последнего вычисленного выражения в блоке 01\еп, если ни одно из 
соответствий не сработало. 


Последнее выражение вычисляется в контексте блока 91\%еп в целом. Обратите 
внимание, что, в отличие от операторов ії и ип]1ез$, оператор мПеп с ложным усло- 
вием всегда возвращает пустой список. 


му %ргісе = до { 
дімеп ($1(ет) { 
мһеп ([“груша”, "яблоко" ]) { 1 } 
ргеак мпеп "моіе"; # Мой голос не продается 
1е10 мпеп /Мона Лиза/; 
“неизвестно”; 


}; 


Обратите внимание, что в примере выше пришлось использовать блок 00, иначе 
оператор діуеп интерпретируется как обычная инструкция, и не может распола- 
гаться справа от оператора присваивания. (Возможно, в будущих версиях Рей 
мы сделаем использование 00 необязательным.) 


Оператор и модификатор мћеп 


Мощь оператора 91уеп сосредоточена, по преимуществу, в неявном интеллекту- 
альном сопоставлении, которое подразумевается различными типами данных. 
Конструкция мһеп(ЕХРА) по умолчанию интерпретируется как неявное интеллек- 
туальное сопоставление переменной $_ с выражением ЕХРИЯ; т.е. как $_ -- ЕХРР. 
(Подробнее об интеллектуальном сопоставлении рассказывается в главе 3.) Одна- 
ко, если аргумент ЕХРВ оператора мђег имеет одну из перечисленных ниже специ- 
альных форм, результат вычисления этого выражения ЕХРЯ преобразуется в логи- 
ческое значение, а интеллектуальное сопоставление не выполняется: 


1. Вызов пользовательской подпрограммы или метода. 
2. Сопоставление с регулярным выражением в форме /ПЕСЕХ/, $Роо =- /АЕСЕХ/ или 
$Роо =- ЕХРИ. 


8. Выражение, явно использующее -- (оператор интеллектуального сопоставле- 
ния), такое как ЕХ -- ЕХРА. (Явное интеллектуальное сопоставление переменной 
$ может потребоваться, например, чтобы обратить использование встроенного 
полиморфизма механизма интеллектуального сопоставления оператора мћеп.) 


4. Оператор отношения, такой как $_ < 10 или $х ед “абс”, возвращающий логи- 
ческий результат. Сюда относятся шесть операторов сравнения чисел (<, >, <=, 
>=, == и !=) и шесть операторов сравнения строк (1, 0%, 1е. де, еа и пе). 


5. Три встроенные функции: деѓіпей, ех1$1$ и еої. 


6. Операторы отрицания выражений !ЕХРА и пої(ЕХРА), а также логическое ИС- 
КЛЮЧАЮЩЕЕ ИЛИ, ЕХРА7 хог ЕХРЕ2. (Поразрядные версии этих операторов, 
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- и 7, сюда не относятся.) В эту категорию также попадает отрицание регуляр- 
ного выражения в любой форме записи ' /ВЕСЕХ/, $Роо !- /ВЕСЕХ/ или $Тоо !- ЕХРА. 


7. Операторы проверки файлов (кроме -5, -М, -А и -С, так как они возвращают чи- 
словые значения, а не логические). 


8. Операторы и .. (Обратите внимание, что инфиксная операция совершен- 
но отличается от многоточия ..., которое распознается только там, где ожида- 
ется оператор.) 


В первых восьми случаях операнд ЕХРА используется непосредственно как логиче- 
ское значение, поэтому интеллектуальное сопоставление не выполняется. Опера- 
тор мпеп можно считать еще более интеллектуальным оператором интеллектуаль- 
ного сопоставления. Чтобы сделать его еще более интеллектуальным, Реті при- 
меняет все эти проверки к операндам логических операторов (т.е. «И» и «ИЛИ») 
рекурсивно, чтобы определить, следует ли использовать интеллектуальное со- 
поставление, как описывается ниже: 


1. В выражениях ЕХРА1 && ЕХРА2 и ЕХРА1 апа ЕХРА2 проверка применяется рекур- 
сивно к обоим операндам, ЕХРА1 и ЕХРА2. Все выражение считается логическим, 
только если оба операнда прошли проверку. В противном случае выполняется 
интеллектуальное сопоставление. 


2. В выражениях ЕХРП1 || ЕХРЕ2 и ЕХРА1 ог ЕХРЕ? проверка рекурсивно применяет- 
ся только к операнду ЕХРЯЇ (который, например, сам может быть логическим 
выражением с высокоприоритетным оператором И, и потому подпадать под 
действие предыдущего правила), но не к операнду ЕХРЕ2. Если операнд ЕХРАТ 
требует применения интеллектуального сопоставления, ко второму операнду 
ЕХРЕ2 также будет применено интеллектуальное сопоставление, независимо от 
типа операнда ЕХРА2. Но если первый аргумент в ЕХРЕ1 не требует интеллекту- 
ального сопоставления, оно не будет использоваться и для второго аргумента. 
Этим данный тип выражений существенно отличается от выражений с опера- 
тором &&, описанных выше, поэтому будьте внимательны. (Имейте в виду, что 
выражения ЕХРПЇ // ЕХРЕ2 всегда интерпретируются как логические, потому 
что подразумевают наличие функции ве! 114 слева от оператора //.) 


Из-за всех этих правил жизнь начинает казаться сложнее, чем есті. Они необхо- 
димы потому, что в Рей 5 отсутствует встроенный логический тип.? Их назначе- 
ние — выполнять те действия, которые вы подразумеваете. Например: 


мһеп (/^\9+$/ && $_ < 75) { } 
будет интерпретироваться как логическое выражение, потому что. согласно пра- 
вилам, обе стороны выражения являются логическими. 
А для: 

мһеп ([ом(Роо баг) ] && /ба2/) { 


Полезно также считать логические выражения одной из разновидностей интеллекту- 
ального сопоставления, потому что в Рег] 6 они таковыми и являются, и вам, возмож- 
но, время от времени придется менять свой взгляд на них. 


2 Пока, по крайней мере. Встроенный логический тип может появиться в будущих вер- 
сиях Регі, и тогда все эти сложные правила отпадут естественным образом 
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будет использовано интеллектуальное сопоставление, потому что только второй 
операнд выглядит как логическое значение. Первый операнд не похож на логиче- 
ское значение, поэтому побеждает интеллектуальное сопоставление — иначе воз- 
никает логическая ошибка, если только не предполагается выполнить интеллек- 
туальное сопоставление с результатом справа, имеющим значение 1 или ``. Од- 
нако вы едва ли будете использовать для этого оператор дімеп. 


Помните, что в операциях дизъюнкции порядок имеет значение. Если сказать: 
мһеп (Гам(Ғоо раг) ] || /7ба2/) { .. } 


исходя из первого операнда, Ре! применит интеллектуальное сопоставление. Но 
в случае 


мһеп (/7ба2/ || Гом(Ғоо баг) ]) { } 


слева находится регулярное выражение (логический операнд), из-за чего оба опе- 
ранда будут считаться логическими. И снова возникает логическая ошибка, по- 
тому что второй аргумент (ссылка на массив) всегда принимает истинное значе- 
ние, поэтому проверяться будет совсем не то, что предполагается. 


Логические операторы, выполняющие операции с константами, подвергаются 
глубокой оптимизации. Бессмысленно писать: 


мһеп ("Ғоо” ог раг”) { } 


Потому что это выражение будет оптимизировано до "Гоо", и значение "раг" нико- 
гда не будет рассматриваться (даже при том, что правила требуют применения 
интеллектуального сопоставления с "Гоо"). В случаях, когда требуется организо- 
вать сопоставление с несколькими альтернативами, как в данном примере, сле- 
дует использовать ссылки на массивы, потому что это приведет к необходимости 
выполнить интеллектуальное сопоставление, имеющее собственную семантику 
«соответствует какому-либо элементу в»: 


мһеп ([‘Роо , баг’ ]) { } 


Этот же прием используется для сопоставления нескольких «меток» с одним бло- 
ком логики, поскольку в Регі отсутствует семантика автоматического перехода 
к проверке последующих «меток», существующая в языке С. 


Ветвь беѓаџ1+ действует в точности, как мћеп(1 == 1), т.е. соответствует всегда. По- 
скольку предложения мћеп вычисляются по порядку, предложение сеѓаџії долж- 
но быть последним — подобно мПеп оно неявно выполняет оператор бгеак, поэтому 
нижележащий код в операторе діхеп не выполняется никогда. 


В помощь семантике интеллектуального сопоставления, если в качестве аргумен- 
та оператору діуеп передается литеральный массив или хеш, он будет преобразо- 
ван в ссылку, чтобы не потерять какую-либо информацию. Поэтому, например, 
діуеп(@ғоо) суть то же самое, что и дімеп(\ёѓоо). Если потребуется, чтобы в сопостав- 
лении использовалась длина массива @ѓоо, следует явно сказать діуеп(ѕса:аг @ѓоо). 


Мы продолжаем считать некоторые особенности операторов д1\еп и ипеп экспери- 
ментальными, но вы можете быть уверены, что инструкции выбора, основанные 
на сопоставлении с простыми строками и числами, всегда будут действовать, как 
вы того ожидаете. 
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Операторы циклов 


Формальный синтаксис любого оператора цикла допускает использование необя- 
зательной метки [АВЕ!. (Метку можно прикрепить к любому оператору, но в цик- 
ле она имеет особое значение.) Метка состоит из идентификатора и следующего 
за ним двоеточия. Принято записывать метки символами в верхнем регистре, 
чтобы избежать конфликта с зарезервированными словами и для удобства чте- 
ния. (Рей не сбить с толку меткой, уже имеющей значение, например, меткой ії 
или ореп, чего нельзя сказать о тех, кто будет читать вашу программу.) 


Операторы м/ Ме и ип 


Оператор мп11е повторяет выполнение блока, пока выражение ЕХРР остается истин- 
ным. Если слово ићі1е заменить словом ип{11, то смысл проверки становится про- 
тивоположным, т.е. блок выполняется, только пока ЕХРА имеет значение «ложь». 
Однако условие все равно проверяется перед первой итерацией цикла. 


Операторы мһі1е или џпіі1 могут иметь необязательный дополнительный блок 
сопііпие, который выполняется в начале итерации -— при выходе за конец основно- 
го блока или при явном вызове пехї (операция управления циклом, которая вызы- 
вает переход к новой итерации). На практике блок сопїіпџе применяется не слиш- 
ком часто, но, рассказав о нем, мы теперь сможем строго определить трехчастный 
цикл Гог в следующем разделе. 


В отличие от цикла Гогеасй, который мы рассмотрим несколько позже, цикл мћі1е 
официально не имеет переменной цикла.? Однако у вас есть возможность объ- 
явить переменные явно. Область видимости переменных, объявленных в услов- 
ном выражении оператора мћі1е или ипіі1, ограничивается одним или нескольки- 
ми блоками, на которые распространяется действие этого условия, Они недоступ- 
ны в охватывающей области видимости. Например: 


мћі1е (ту $1іпе = <5Т01№) { 
$1іпе = 1с $11те; 
} 
сопїіпџе { 
ргіпі $11пе; # переменная пока видима 
} 


# теперь $11пе ушла из области видимости 


В данном случае область видимости $1-ге простирается от ее объявления в управ- 
ляющем выражении на всю конструкцию цикла, включая блок пі пие, но не 
далее того. Если необходимо расширить область видимости, объявите перемен- 
ную перед циклом. 


До версии у5.14 метку нельзя было прикрепить к оператору раскаде. 


Как следствие, мһі1е не локализует переменные в проверяемом условии неявным обра- 
зом. В результате могут возникнуть «интересные» последствия, если в цикле ип е ис- 
пользуются операторы, неявно знающие о существовании таких глобальных перемен- 
ных, как $_. В частности, в разделе «Оператор ввода строки (угловых скобок)» главы 2 
вы можете узнать, как в некоторых циклах мһі16 может происходить неявное присваи- 
вание глобальной переменной $_, а также увидеть пример решения этой проблемы. 
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Трехчастные циклы 


Круглые скобки трехчастного цикла! содержат три выражения, разделенные точ- 
кой с запятой. Эти выражения служат, соответственно, для инициализации, про- 
верки условия и реинициализации цикла. Круглые скобки и две точки с запятой 
являются обязательными элементами, но сами выражения можно опустить. Выра- 
жения инициализации и реиницилизации, если они опущены, ничего не делают. 
Выражение проверки условия, если оно опущено, всегда считается истинным. 
(Значения выражений инициализации и реинициализации не играют никакой ро- 
ли, поскольку эти выражения вычисляются только ради их побочных эффектов.) 


Таким образом, трехчастный цикл можно определить через соответствующий 
цикл ип Пе, внедрив в него все три выражения. Когда вы говорите: 


АВЕ 
Рог (ту $1 = 1; $1 <= 10; $1++) { 


} 
Рей за кулисами превращает ее в конструкцию, действующую так: 


{ 
пу $1 = 1 
ТАВЕЕ : 
мһі1е ($1 <= 10) { 


} 
соптіпџе { 
$1++; 


} 


(за исключением того, что охватывающего блока на самом деле нет, и мы обозна- 
чили его, только чтобы показать границы области видимости ^\,). 


Если необходимо производить итерацию одновременно по двум переменным, 
просто разделите параллельные выражения запятыми: 


ту $1, 

ту $615; 

Рог ($1 = 0, $011 = 0; $1 < 32; $1++ $01ї <<= 1) { 
зау "Бит $1 установлен” ј? $паѕк & $511; 

} 


# значения $1 и $611 сохраняются после конца цикла 


Можно объявить эти переменные и так. чтобы они были видимы только внутри 
цикла: 


Ғог (пу ($1, $621) = (0, 1), $1 < 32; $1++, $011 <<= 1) { 
ѕау "Бит $1 установлен” і? Фтазк & $611; 
} 


# теперь $1 и $611, объявленные для цикла, вышли из области видимости 


Также известен как цикл Гог, но это название может вас запутать, поскольку в Ре] 
имеются циклы Гог, не являющиеся трехчастными. Из этих соображений мы стараем- 
ся неиспользовать данное название. 
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Помимо обычного перебора индексов массива, трехчастный цикл может служить 
многим другим интересных задачам. Ему даже не требуется явная переменная 
цикла. Вот пример того, как можно избежать проблемы, возникающей при явной 
проверке конца файла в интерактивном дескрипторе файла и приводящей про- 
грамму к зависанию. 


фоп а їїу = -1 ЭТОТ && -Е УТ00УТ; 
ѕир рготр { ргіпї "да? " 11 $оп а ї+у } 
Ғог ( рготрі(); <5Т0ІМ; рготрі() ) { 

# какие-то действия 


} 


Еще одно традиционное применение трехчастного цикла — «бесконечный цикл». 
Поскольку все три выражения не обязательны, а условие по умолчанию является 
истинным, цикл можно записать так: 


Тог (;;) 4 
} 
Это то же самое, что 


ме (1) { 


} 


Если вас смущает идея бесконечного цикла, то следует заметить, что всегда мож- 
но выйти из цикла в любой его точке, применив явную операцию управления цик- 
лом, такую как 1451. Конечно, если вы пишете программа управления для ядерной 
крылатой ракеты, явный выход из цикла может не потребоваться. В должное вре- 
мя цикл завершится автоматически.! 


Циклы ?огеасһ 


Эта разновидность циклов осуществляет перебор списка значений, последова- 
тельно устанавливая управляющую переменную (УАЛ) равной каждому элементу 
списка: 


Тог ту МАН (1Т$Т) { 


} 


Если часть пу УАВ отсутствует, используется глобальная переменная $_. Определе- 
ние пу можно опустить, но только в отсутствие объявления изе 51г1ст. 


По историческим причинам синонимом ключевого слова Гог служит ключевое 
слово Гогеасйп, поэтому Тог и Ғогеасћ можно использовать взаимозаменяемо и в за- 
висимости от того, которое из них в конкретной ситуации лучше смотрится. Мы 
предпочитаем использовать Гог, потому что мы ленивы и потому что это слово 
удобнее читать, особенно с объявлением пу. (Не беспокойтесь, Ре! легко отличит 
Ғог (@АНС\) от Рог ($1=0; $1<$НАВСУ; $1++), поскольку в последнем содержатся точки 
с запятой.) Вот несколько примеров: 


Б То есть имеется тенденция к автоматическому падению из цикла. 
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фѕит = 0; 
Гог ту $уа1ие (@аггау) { $зит += $уаше } 


Гог ту фсоџпі (10,9,8,7,6,5,4.3,2,1, `БУМ!°) { # обратный отсчет 
ѕау $соџпїі; 
51еер(1); 


Рог (гемегзе ` БУМ! `, 1 .. 10) { # то же самое 
зау; 
ѕ1еер(1); 


Рог ту $Ғіе1а0 (зразф /:/, Фоата) { # любое списочное выражение 
зау "Поле содержит: ‘ФҒіе1а'"; 


Тог ту $кеу (ѕогі кеуѕ Жһаѕһ) { 
ѕау “$Кеу => $назн{$кеу}”; 


Последний пример представляет собой канонический способ вывода значений хе- 
ша в отсортированном порядке. Более подробные примеры можно найти в описа- 
ниях Кеуѕ и 50гї в главе 27. 


В процессе выполнения цикла Гог невозможно узнать, в какой точке списка вы 
находитесь. Можно запоминать предыдущий элемент списка в переменной и срав- 
нивать соседние элементы, но часто приходится просто взять и написать трехча- 
стный цикл Гог, перебирающий индексы. В конце концов, для того и существуют 
два типа цикла. 


Если список / 157 состоит только из значений, допускающих присваивание (обыч- 
но речь о переменных, а не о перечислениях констант), все эти переменные могут 
быть модифицированы путем изменения "АВ внутри цикла. Это возможно потому, 
что переменная цикла представляет собой неявный псевдоним для каждого эле- 
мента обрабатываемого списка. Можно изменить не только один массив, а сразу 
несколько массивов и хешей, находящихся в одном списке: 


Гог ту Фрау (@ѕа1агіеѕ) { й всем прибавка 8% 
фрау *= 1.08; 

} 

Гог (@сһгіѕітаѕ, @еаѕїег) { # изменить меню 
ѕ/һат/+игкеу/; 


} 
$/ват/тигКеу/ Рог @сһгіѕітаѕ, @еаѕїег; # `то же 


Тог ($ѕса1аг, @аггау, уа1џеѕ %пазп) { 
$/^\$+//; # удалить начальные пробелы 
$/\$+$//; # удалить замыкающие пробелы 


} 


Переменная цикла действует только в динамической или лексической области 
видимости цикла и неявно становится лексической, если предварительно объяв- 
лена с помощью пу. Благодаря этому она невидима для всех функций, определен- 
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ных вне области лексической видимости этой переменной, даже если они вызыва- 
ются из этого цикла. Однакоесли в области видимости нет лексического объявле- 
ния, переменная цикла станет локализованной глобальной переменной (с дина- 
мической областью видимости); это позволит функциям, вызываемым из цикла, 
обращаться к этой переменной. В любом случае, предыдущее значение, которое 
локализованная переменная имела до выполнения цикла. будет восстановлено 
при выходе из него. 


При желании можно явно определить вид (лексический или глобальный) исполь- 
зуемой переменной. Это облегчит работу тех, кто будет сопровождать ваш код; 
в противном случае им придется искать в охватывающих областях видимости 
предыдущее объявление, чтобы определить вид этой переменной: 


Тог му $1 (1 10) {... } #$1 всегда лексическая 
Рог оиг $Тіск (1 10) {... } #8 $Тіск всегда глобальная 


Если переменная цикла сопровождается объявлением, то предпочтительнее ис- 
пользовать более краткую форму Гог, а не Ѓогеасћ, поскольку она лучше читается 
на английском языке. 


Вот как программист на С или Јауа мог бы поначалу решить запрограммировать 
некоторый алгоритм на Ре: 


Рог ($1 = 0; $1 < багу1; Я) { 

Рог ($) = 0; $] < @агу2; $ј++) { 

1Ғ ($агу1[$1] > $агу2[%]1) { 
1851; # Нельзя выйти во внешний цикл 

} 
фагу1[$1] += $агу2[$] 1; 

} 

# сюда приведет 1аѕї 


} 
А вот как поступил бы ветеран программирования на Регі: 


МІО: Гог ту $1015 (@агу1) { 
ЧЕТ: Рог ту $1һаї (@агу2) { 
пех МІР 1? $1һіѕ > $їһаї; 
$111$ += $еваг; 


} 


Видите, насколько легче это делается с помощью идиом Рег? Аккуратнее, на- 
дежнее и быстрее. Аккуратнее, поскольку меньше шума. Надежнее, поскольку 
если позже добавить код между внутренним и внешним циклами, новый код не 
будет выполнен по ошибке, так как операция пехї (о которой говорится ниже) яв- 
но выполняет переход на следующую итерацию внешнего цикла, а не просто вы- 
ходит из внутреннего. И это быстрее, чем эквивалентный трехчастный цикл, по- 
скольку обращение к элементам выполняется напрямую, а не через индексы. 


Однако пишите так, как вам больше нравится. ТМТОУГТЕЬТ. 


Подобно ип11е, оператор Гогеасп может иметь блок соптапуе. Это позволяет выпол- 
нять фрагмент кода в конце каждой итерации цикла вне зависимости от того, по- 
падаете вы в этот фрагмент выходом из итерации или посредством пехї. 


И теперь мы можем наконец сказать: пехї на очереди. 
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Управление циклом 


Мы уже говорили, что можно добавить метку в заголовок цикла, и тем самым 
дать ему имя. Метка цикла идентифицирует его для операций управления цик- 
лом, таких как пехї, 1аѕї и гедо. Метка обозначает цикл в целом, не только его 
первую строку. Поэтому операция управления циклом, ссылаясь на цикл, вовсе 
не осуществляет переход «50 іо» на метку цикла. Компьютеру все равно. и с та- 
ким же успехом метку можно было бы поместить в конце цикла, но по каким-то 
причинам люди предпочитают, чтобы метка стояла в начале. 


Обычно циклам дают имя по тому элементу, который цикл обрабатывает в каж- 
дой итерации. Это прекрасно сочетается с операциями управления циклом, кото- 
рые проектировались так, чтобы их можно было читать как обычный англий- 
ский язык при использовании надлежащих меток и модификаторов операторов. 
Исконный цикл работает со строками, поэтому исконной меткой цикла является 
ІМЕ:, а исконной операцией управления циклом нечто вроде: 


пехе ІІМЕ 1# /78/; # отбросить комментарии 
Синтаксис операций управления циклом следующий; 


1а5ї ГАВЕЁЕ 
пех САВЕ. 
гедо ГАВЕЁ 


Метка [АВЕ является необязательной; если она опущена, то оператор работает 
с непосредственно охватывающим его циклом. Но если нужно перескочить через 
один или несколько уровней, придется использовать метку, чтобы указать нуж- 
ный вам цикл. Эта метка не обязана попадать в вашу лексическую область види- 
мости, хотя, вероятно, ей следовало бы там находиться. На самом деле метка мо- 
жет находиться в любом месте вашей динамической области видимости. Если 
при этом приходится покидать еуа] или подпрограмму, Рей выдает предупреди- 
тельное сообщение (если его об этом попросить). 


Функция может иметь сколько угодно операторов гетогг, а цикл может иметь 
сколько угодно операций управления циклом. Не следует считать это плохим то- 
ном или некрасивым стилем. На заре структурного программирования некоторые 
настаивали, что на каждый цикл или подпрограмму должен приходиться строго 
один вход и один выход. Единственный вход – и на сегодня остается правильной 
идеей, однако концепция одного выхода заставляет нас писать большие объемы 
неестественного кода. Задачей программирования часто является обход дерева 
решений. Дерево решений обычно начинается с одного ствола и заканчивается 
многочисленными листьями. Вставляйте в код столько выходов из циклов (и воз- 
вратов из функций), сколько свойственно решаемой вами задаче. Если области ви- 
димости переменных определены разумно, то в нужный момент все автоматиче- 
ски очищается — независимо от того, каким образом выполняется выход из блока. 


Операция 1231 осуществляет незамедлительный выход из соответствующего цик- 
ла. Блок сопїілие, если он есть, при этом не выполняется. В следующем примере 
осуществляется «катапультирование» из цикла после обнаружения первой пус- 
той строки: 


ІІМЕ: мп11е (<5Т0ІМ) { 
Іаѕі ИМЕ 14 /7$/; # выйти после обработки почтового заголовка 
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} 


Операция пехї пропускает оставшуюся часть текущей итерации цикла и начина- 
ет следующую. Если в цикле есть блок сопііпие, он выполняется перед очередным 
вычислением условия цикла, точно так же, как третья составляющая трехчаст- 
ного цикла ѓог. Поэтому сопі1пие можно применить для приращения переменной 
цикла, даже если текущая итерация цикла была прервана операцией пехї: 


ИЕ: ме (<5Т0ІМ) { 
пехі ІІМЕ 1+ /7#/; # пропустите комментарии 
пехї ЛмЕ і? / $/; # пропустить пустые строки 


} сопііпџие { 
фсоџп++; 


} 


Оператор гедо перезапускает блок цикла без повторной проверки услових. Блок 
сопїіпие, если он есть, не выполняется. Этот оператор часто используется в про- 
граммах, которым требуется «обмануть» себя, читая данные. Предположим, что 
обрабатывается файл, в котором строка может завершаться обратной косой чер- 
той, означающей продолжение записи на следующей строке. Вот как в этом слу- 
чае можно использовать гео: 


Пе (<>) { 
сһотр; 
1р ($/\\$//) { 
$ = о; 
гедо ип1ез$ еоғ; # не читать после еоР каждогс файла 
} 
# теперь обработать $_ 
} 


Это обычное сокращение Ре! для более явного (и скучного) варианта: 


ИМЕ: мћі1е (деР1пе9($11пе = <АВОМ)) { 
сһотр($1іпе); 
іҒ ($1іпе =- з/\\$//) { 
$1іпе .= <АВОМ; 
гедо ІМЕ џп1еѕѕ ео (АВС\); 
} 
# теперь обработать $1іпе 


} 


Вот пример из реальной программы, использующей все три операции управле- 
ния циклом. Хотя данная стратегия разбора аргументов командной строки реже 
применяется сейчас, когда с Рег] поставляются модули беїорї: :*, она все же пред- 
ставляет собой прекрасную иллюстрацию использования операций управления 
циклом для вложенных циклов с именами: 


АВС: мпі1е (@АВСУ && ФАВСУГО] =- 5/7-(7=. )//) { 
ОРТ: Рог (=һіҒЕ @АВСУ) { 


1 Сравнение основных модулей для разбора аргументов командной строки вы найдете 
в книге «Маѕіегіпе Ре». 
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т/7$/ 8&& до { пехї АВС }; 
т/^-$/ && бо { 1а51 АВС }; 
$/^9// && до { $0ерид Геме1++; гедо ОРТ }; 
5/71// 58 бо { $Сепегате_11$1п9++, гедо ОРТ }; 
$/71(.*)// && до { $1п Р1асе = $1 || “.Бак”; пехі АВС }; 


зау_изаде( "Неизвестный ключ: $_”); 


} 


Еще одно замечание относительно операций управления циклом. Как можно бы- 
ло заметить, мы не называем их операторами. Это связано с тем, что они не явля- 
ются инструкциями, хотя, как всякое выражение, могут использоваться в таком 
качестве. Можно даже представить их себе как унарные операции, которым доз- 
волено изменять порядок выполнения программы. Поэтому их допускается при- 
менять везде, где имеет смысл их использование в выражении. На самом деле 
операции управления циклом можно использовать даже там, где это не имеет 
смысла. Иногда можно встретить в программе такую ошибку: 


ореп ЕІЕ, ‘<’, $ғі1е 
ог магп “Невозможно открыть $111е: $! \п", пехі ЕШЕ, # НЕВЕРНО 


Намерения благие, но пехї ЕЕ будет интерпретироваться как аргумент списоч- 
ного оператора магп. Поэтому пехї выполнится раньше, чем магп получит возмож- 
ность выдать предупреждение. В данном случае ситуацию легко исправить, обра- 
тив списочный оператор магп в вызов функции магп с помощью надлежащим обра- 
зом расставленных скобок: 


ореп ЕШЕ, ‘<’, $#і1е 
ог магп( "Невозможно открыть $111е: $!\п”), пехё ЕЦЕ; # окау 


Однако вы, возможно, сочтете следующий код более прозрачным: 


ип]езз (ореп ЕШЕ, '<°, $#і1е) { 
магп "Невозможно открыть $*11е $'\“ 
пехї ЕЕ; 


Голые блоки в роли циклов 


Отдельный блок, независимо от наличия у него метки, семантически эквивален- 
тен циклу с единственной итерацией. А это позволяет нам использовать 1а5ї для 
выхода из такого блока или гейо для его повторного выполнения.! Заметьте, что 
это не так для блоков в е\а1 {}, ѕир {} и, ко всеобщему удивлению, 00 {}. Эти три 
конструкции - не блоки циклов, поскольку сами по себе вообще не являются бло- 
ками (ВЕ0СК); стоящее впереди ключевое слово делает их просто термами в выра- 
жении — такими, где по случаю оказался блок кода. Поскольку они не являются 
блоками циклов, им нельзя присвоить метку или применить к ним операции 
управления циклом. Операции управления циклом можно использовать только 
в настоящих циклах, так же как геГигп — только в подпрограмме (ну. иещеве\уа1). 


1 По причинам, которые, возможно, прояснятся (а возможно, и нет) после некоторых 


размышлений, оператор пехї тоже осуществляет выход из незацикленного блока. Од- 
нако есть одно отличие: пехї выполнит блок сопїіпие, а 1аѕї – нет. 
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Операции управления циклом не работают также в іѓ и ип!е5$, поскольку это не 
циклы. Но всегда можно вставить дополнительную пару фигурных скобок, чтобы 
создать голый блок, который считается циклом: 


1Р (/раїтегп/) {{ 

1аз і? /а1рћа/; 

1аѕї і? /бета/; 

1аѕї 1ғ /датта/; 

# какие-то действия, если все еще в 1#() 
}} 


Вот каким образом блок, обеспечивает операциям управления циклом возмож- 
ность работать с конструкцией йо {}. Чтобы использовать пехї или гедо в 00. помес- 
тите внутрь голый блок: 


до {{ 

пехе і? $х == Фу, 

# здесь какие-то действия 
}} оптії $х++ > $2; 


Чтобы применить 1а5ї, придется выразиться более прозрачно: 


{ 
до { 
1аѕї 1Е $х = $у ** 2; 
# здесь какие-то действия 
} мне $х++ <= $2: 


} 


А если требуется обеспечить возможность работы с обеими операциями управле- 
ния циклом, придется обозначить эти блоки метками, чтобы их можно было раз- 
личать: 


ВО 1А5Т: { 
до { 

00_МЕХТ: { 
пехї 00_МЕХТ 1 $х == $у; 
1а${ 00 (АТ 17? $х = $у += 
# здесь какие-то действия 

} 
} мһі1е $х++ <= $7 


} 


Но, дойдя до такой конструкции (а то и раньше), лучше всего организовать обыч- 
ный бесконечный цикл с 1а5ї в конце: 


Рог (;;) { 
пехЕ і? $х == Фу 
1аѕ і? $х = $у ** 2; 
# здесь какие-то действия 
Іаѕї ип1еѕѕ $х++ <= $2; 


} 


Выбор тем с помощью циклов 


Рен не ограничивается одним оператором проверки соответствия указанной те- 
ме. Помимо оператора діхеп, для этой цели можно также использовать оператор 
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Гогеасн. Например, вот один из способов подсчитать количество вхождений стро- 
ки в массив: 


и5е 5.10.1, 
ту ФсоийЕ = 0, 
Гог (@аггау) { 
мһеп (“ЕМОВО") { ++ФсоџпЕ } 
} 


ргіпт “\@аггау содержит $соџпт копий строки "ЕМОВО `\п”; 
Или, при использовании более свежей версии Реп: 


иѕе №5. 14; 
ту Ф$соџпї = 0; 
Ғог (@аггау) { 
++фсоџпї мћеп “ЕМ№ОАО” ; 
} 
ргіпё “\@аггау содержит $соипї копий строки ' ЕМОВО `\п ; 


В конце всех блоков мһеп внутри цикла Ѓогеасћ неявно выполняется оператор 
ргеак, который внутри циклов эквивалентен операции пехї. Если вас интересует 
только первое совпадение, такое поведение можно переопределить посредством 
явной операции 1а5ї. 


Оператор мһеп действует, только если тема хранится в переменной $_, поэтому 
в таких случаях не получится использовать переменные цикла: если обращение 
к переменной происходит, это должна быть переменная $ : 


ог му $_ (Фапзмег$) { 
ѕау "Жизнь, Вселенная и все сущее!” мпеп 42; 


} 


Оператор доїо 


Не по малодушию (но и не с легким сердцем) Рей все же поддерживает оператор 
дото, который бывает трех видов: 9010 ГАВЕ!, с Го ЕХРВ и 997о &/АМЕ. 


дото [АВЕ находит оператор с меткой АВЕ! и продолжает выполнение с него. Дан- 
ную форму нельзя применять для перехода в какую-либо конструкцию, требую- 
щую инициализации, например, подпрограмму или цикл Гогеаси. Нельзя также 
использовать ее для перехода в конструкцию, удаленную в результате оптимиза- 
ции (см. главу 16). Она позволяет перейти почти в любое другое местс в текущем 
блоке или любом блоке динамической области видимости (т.е. блоке, из которого 
был произведен вызов). Посредством 9010 можно даже выходить из подпрограмм, 
но обычно лучше делать это другими средствами. Автор Рей никогда не испыты- 
вал потребности использовать эту форму доїо (хотя был вынужден сделать это 
в тестах, проверяющих работу этого оператора). 


Форма доїо ЕХРА является просто обобщением дото [АВЕЁ. Предполагается, что ре- 
зультат вычисления выражения ЕХРВ представляет собой имя метки, местонахо- 
ждение которой, очевидно, должно динамически определяться интерпретатором. 
В результате можно применять вычисляемые переходы, как в ГОКТКАМ, что, ес- 
ли требуется облегчить сопровождение кода, не обязательно окажется хорошей 
идеей: 
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дото(("ЕОО”, “ВАН”, “СбЬАВСН“)[$1]); # в надежде, что 0 <= і < З 


®1оор Лабре1 = дм/ЕОО ВАА СЬАВСНИ, 
900 $100ор 1абе1[ гапа @1оор_1аое1]; # случайная телепортация 


В большинстве подобных случаев обычно гораздо (гораздо) более правильным ре- 
шением является применение структурных механизмов управления последова- 
тельностью выполнения (пехї, 1аѕї и гедо), а не использование 0010. В некоторых 
приложениях разумнее использовать хеш со ссылками нг функции или пары 
е\уа1 и Піе для обработки исключительных ситуаций. 


Форма 0010 &МАМЕ является исключительно волшебной, и она достаточно далека от 
обычного доїо, чтобы избавить применяющих ее от бесчестья, уготованного исто- 
рией поклонникам 0010. Она вызывает указанную подпрограмму вместо подиро- 
граммы, выполняющейся в данный момент. Такое свойство этого оператора ис- 
пользуется подпрограммами АОТОГОАО, чтобы загрузить другую подпрограмму, 
а затем представить дело так, будто та, другая подпрограмма и была вызвана изна- 
чально. После доїо-перехода даже функция са11ег не сможет определить, что пер- 
вой была вызвана данная подпрограмма. Все модули аиТоцзе, Аџїоі оадег и 5е1.оадег 
используют эту стратегию, чтобы определять функции при первом к ним обраще- 
нии, а затем передавать в них управление, так что никто никогда и не заметит, что 
этих функций в начале не было. Данная операция не особенно дешевая, так что не 
считайте ее эквивалентом хвостовой оптимизации. 


Окаменевшие $м/сИ/са$е 


В первые двадцать лет жизни Ре!] этот язык официально не имел оператора $и11сп 
или саѕе. До появления оператора 91\еп в У5.10 программисты были вынуждены 
изобретать собственные структуры ветвления на основе голых блоков и однопрс- 
ходных циклов Фогеасй. Вот один пример: 


ЗМТТСН: { 
іг (/‘абс/) { $арс 
11 (/7@е?/) { %@еғ 
11 (/7ху2/) { $хуг 
фпоћіпд = 1; 


1; 1аѕї МІТСН 
1: 1аѕї 5МІТСН 
1 1аѕт ЅЖІТС" 


} 
а вот другой: 


ЗМТТСН: { 
/?абс/ 88 до { $абс = 1; 1аѕі МІТСН; }; 
/7де?/ 58 бо { 1; 1азё ЅИТТСН; }; 
/ху2/ 58 до { $ху2 = 1; 1аѕї ЅМІТСН; }; 
фпоіћіпо = 1; 


га 
о 
Ф 
— 
Ш 


} 
или даже просто: 


іҒ (/^абс/) { Фабс 
е151? (/70еғ/) { $деЁ = 1 
е151Ғ (/7ху2/) { $худ = 1 
е15е { Фпоћіпо 


1 


и--- 
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А в следующем примере обратите внимание на то удобное обстоятельство, что 
операции 1а5ї игнорируют блоки 00 {}, которые не являются циклами, и осуще: 
ствляют выход из главного цикла: 


Гог ($\егу_пазту_1опд_пате[$1++][$1++]->те{под()) { 


/один шаблон/ апд до { риѕћ @ғ1адѕ, ‘-е’; 1а5ї }; 
/другой/ апа до { роѕћ @Е1адз, '-һ`: 1аѕі }; 
/третий/ апа до { 1аѕі }; 


діе "неизвестное значение: '$_ ; 


} 


Эти идиомы вы будете время от времени встречать в старых программах на Рег], 
потому что до появления о1уеп цикл Гог был единственной возможностью реали- 
зовать выбор из множества тем. 


Независимо от того, какая конструкция применяется для выбора тем, если есть 
возможность указать проверяемое значение лишь единожды, это здорово облег- 
чает набор текста и, соответственно, снижает вероятность появления опечаток. 
Устраняется также возможность получения побочного эффекта от повторного 
вычисления выражения. 


В простых случаях можно также каскадировать оператор ?:. В следующем при- 
мере мы снова прибегаем к оператору Гог и его свойству создания псевдонимов, 
чтобы улучшить читаемость повторных сравнений: 


Рог (Физег_со1ог_ргеРегепсе) { 
фуа1ие = /гед/ ? охн—о000 
/дгееп/ ? 0х00ЕРО0 : 
/о1ие/ ? 0х0000ЕЕ * 
0х000000 ; # черный, если нет совпадений 


} 


Однако во многих ситуациях бывает более уместно создать собственный хеш 
и быстро найти в нем ответ по ключу. В отличие от только что показанного каска- 
дирования условных операторов, хеш может содержать неограниченное число 
элементов, и время поиска последнего из них ничуть не больше, чем первого. Бс- 
лее того, хеш позволяет добавлять варианты выбора прямо во время выполнения. 
Недостаток в том, что можно использовать только точный поиск, но не соответст- 
вие шаблону. Если есть такой хеш: 


Усо1ог_тар = ( 
ағиге => ОхРОЕЕЕЕ, 
спагЕгеизе => 0х7ЕЕЕОО, 
1амепдег => ОхЕбЕбРА, 
мадепта => ОхЕРООЕЕ, 
игдио15е => 0х40Е000, 
): 


точный поиск строки выполняется быстро, и по-прежнему есть возможность до- 
бавить значение по умолчанию: 


фуа1џе = $со1ог пар{ 1с Физег_созог_ргеРегепсе } || 0х000000; 


Даже сложные многократно ветвящиеся операторы (где в каждом случае требу- 
ется выполнить несколько различных операторов) можно превратить в быстрый 
поиск по хешу. Нужно только использовать хеш ссылок на функции, которые 
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в Рей являются законными типами данных. Как это делается, рассказано в раз- 
деле «Хеши функций» главы 9. 


Ко всему вышесказанному остается только добавить, что структуры выбора из 
нескольких вариантов – не всегда самый удачный инструмент вашего арсенала. 
Наиболее расширяемый способ реализации поиска заключается в использова- 
нии полиморфизма объектов. Если вам не терпится узнать об этом поскорее, за- 
гляните в главу 12. 


Ниже приводится пример еще одной ужасающий структуры выбора: 


дото $дата; 

АВС: $Р00++; дото епа; 
ЮЕЕ: $баг++; дото епа; 
ХҮ2: $раг++, доїо епа; 
епа: 


Да, она работает, но... очень медленно, и если ни одна из меток не совпадет с иско- 
мым значением, поиск будет продолжен вплоть до конца программы и, если вам 
повезет, приведет к сбою. Однако существуют более удачные способы вызвать 
аварийное завершение программы, и об одном из них рассказывается в следую- 
щем разделе. 


Оператор многоточия 


В Рей версии у5.12 появился оператор голое многоточие «. », играющий роль за- 
глушки, или метки-заполнителя для еще не написанного кода программы. Не пу- 
тайте его с оператором диапазона, . . Рег! обычно их не путает, потому что в боль- 
шинстве случаев может четко сказать, когда ожидает встретить тот или иной опе- 
ратор — в большинстве случаев, но не всегда. 


Когда Реп встречает оператор многоточия на этапе компиляции, то принимает 
его молча. Однако позднее, если программа попытается выполнить этот опера- 
тор, Рей возмущенно возбудит исключение с текстом "Цп1пр1етелтед”; 


зуб ипітр1іетепїеа {.. } 
ема1 { ипітр1етеп+еа() }; 
1е ($0 =- /`Упипртетептеа/) { 
зау “Возникло исключение Шпітр! епеп+ей" 


} 


Оператор многоточия разрешается использовать только на этапе компиляции 
и только как законченную инструкцию (однако допускается использовать моди- 
фикатор оператора). Все следующие примеры являются допустимыми примера- 
ми использования оператора многоточия: 


е: 
ѕир Ғоо { } 


е\уа1 {.. }; 

џп1е95$ дбеғіпеа &01ѕраїсћһег, 
ѕир зотететн { 
ту $зе1{ = ѕһіғі: 


. 
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$х = до { 
ту $; 


ѕау “Ниггай! “, 
$п; 
}; 
Однако оператор. не может быть частью выражения или составного операто- 
ра, поскольку существует также трехточечная (...) версия оператора диапазона 
(см. раздел «Операторы диапазона» в главе 3). По этой причине все следующие 
примеры содержат ошибки синтаксиса: 


ргіпї ..., # НЕВЕРНО 
ореп(ту ФЁһ, “> , “/дем/раззмд”) ог ., # НЕВЕРНО 
1ғ ($сопдітіоп && .. ) { ѕау "Ному" }; # НЕВЕРНО 


В некоторых ситуациях Рег может не различать выражения и операторы. Напри- 
мер, голый блок и объявление анонимного хеша выглядят одинаково, если внут- 
ри скобок нет чего-то еще, позволяющего Рег! понять, с чем именно он имеет дело: 


@тгапзРогтед = тар { } @приё; # НЕВЕРНО: ошибка синтаксиса 


Одно из решений этой проблемы заключается в использовании ; внутри блока, 
чтобы подсказать Регі, что { ... } – это блок, а не анонимный хеш: 


1 


бігапѕғогтеа = тар {; .. } @іприї; # , однозначно определяет оператор многоточия 
@ТгапзРогтед = пар { .. } @іприї; # ; однозначно определяет оператор многоточия 


і 


Программисты в разговорах между собой называют такие знаки пунктуации 
«уада-уада» («и тому подобное», или «и прочее»), но вы можете использовать тех- 
нический термин «многоточие», если желаете произвести впечатление на особо 
впечатлительных. Рен не распознает версию многоточия в виде символа Юнико- 
да +2026 НОАТ7ОМТАЕ ЕШ.1Р515, но может быть, в один прекрасный день... 


Глобальные объявления 


Объявления подпрограмм и форматов являются глобальными. Независимо от то- 
го, куда они помещены, объявляемые ими элементы являются глобальными (ло- 
кальными для пакета, но пакеты глобальны для программы, поэтому все, что 
находится в пакете, видимо в любом месте). Глобальное объявление можно по- 
местить в любое место, где может находиться оператор, но оно не оказывает влия- 
ния на выполнение основной последовательности операторов: действие объявле- 
ний сказывается только на этапе компиляции. 


Это значит, что нельзя создавать условныє объявления подпрограмм или форма- 
тов, скрывая их от компилятора в условных операторах этапа выполнения типа 
1, поскольку только интерпретатор обращает внимание на условное выполнение 
этих операторов. Объявления подпрограмм и форматов (а также объявления изе 
и по) видны компилятору независимо от того, где они находятся. 


Глобальные объявления обычно помещаются в начале или конце программы ли- 
бо отдельно в другом файле. Однако при объявлении переменных с лексической 
областью видимости (см. следующий раздел) нужно обеспечить, чтобы определе- 
ние формата или подпрограммы попало в область видимости объявлений тех пе- 
ременных, доступ к которым вы хотите иметь в этом определении. 
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Заметьте, что мы незаметно перешли в разговоре с объявлений на определения. 
Иногда полезно разделить определение (деѓіпіїііоп) подпрограммы и ее объявление 
(аедаганоп). Единственная синтаксическая разница между ними в том, что опре- 
деление включает блок, содержащий код, который должен быть выполнен, а в объ- 
явлении его нет. (Определение подпрограммы действует как ее объявление, если 
объявления нет в области видимости.) Отделение определения от объявления по- 
зволяет поместить объявление подпрограммы в начало файла, а определение ~ 
в конец (при этом ваши объявления переменных с лексической областью видимо- 
сти удачно располагаются посередине): 


ѕир соийт (@): # Теперь компилятор знает, как вызывать соип*(). 
ту $х. # Теперь компилятор знает о лексической переменной. 
$х = соџпї(3,2, 1); # Компилятор может проверить вызов функции. 


зиб соийе (@) { @ } # Теперь компилятор знает, что означает соипі(). 


Как показывает этот пример, присутствие фактических определений подпро- 
грамм не требуется, чтобы их вызовы могли быть скомпилированы (более того, 
определение можно даже отложить до первого вызова, если применяется автоза- 
грузка), однако объявление подпрограмм оказывает компилятору различную по- 
мощь и дает вам большую свободу ь способах их вызова. 


Объявление подпрограммы позволяет начать использовать ее с точки объявле- 
ния, без скобок, как если бы это был встроенный оператор. (В последнем примере 
мы использовали скобки для вызова соипт, но фактически в этом нет необходимо- 
сти.) Чтобы объявить подпрограмму. не определяя ее. скажите просто: 


ѕиб тупате; 
фте = тупате $0 ог діе "Не могу найти тупае , 


Такое голое объявление делает функцию списочным, а не унарным оператором, 
поэтому будьте внимательны и применяйте ог, ане ||. Оператор | слишком силь- 
но связывает аргументы, чтобы использовать его после списочных операторов, 
хотя аргументы списочного оператора всегда можно заключить в круглые скоб- 
ки, превратив его снова в нечто, более похожее на вызов функции. Альтернатив- 
ным вариантом является использование прототипа ($), позволяющее превратить 
подпрограмму в унарный оператор: 


ѕир тупате ($); 
$те = тупате $0 || а1е ” Не могу найти тупапе”; 


Теперь Ре! разберет код так, как вы ожидаете, но все же следует выработать при- 
вычку использовать в такой ситуации скобки. Подробнее о прототипах читайте 
вглаве 7. 


Вы обязаны определить подпрограмму в каком-то месте, иначе на этапе выполне- 
ния получите ошибку, указывающую на вызов процедуры, которая не определе- 
на. Помимо самостоятельного определения подпрограммы есть несколько спосо- 
бов получать определения из других мест. 


Определения можно загружать из других файлов с помощью простого оператора 
гедиіге. В Рей 4 это был лучший способ загрузки файлов, но с ним связаны две 
проблемы. Во-первых, другой файл обычно помещает имена подпрограмм в па- 
кет (таблицу имен) по собственному выбору, а не в ваши пакеты. Во-вторых, обра- 
щение к гедиіге происходит на этапе выполнения, т.е. слишком поздно, чтобы 
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предоставлять объявления файлу, вызывающему гедиіге. Иногда, впрочем, отло- 
женная загрузка — это именно то, что доктор прописал. 


Более удобный способ загрузки объявлений и определений предоставляет дирек- 
тива изе, которая, по сути, вызывает гедиіге для модуля на этапе компиляции (по- 
скольку изе рассматривается как блок ВЕСТ) и позволяет импортировать некото- 
рые из объявлений модуля в вашу программу. Так что иѕе можно рассматривать 
как своего рода глобальное объявление, ведь на этапе компиляции эта инструк: 
ция импортирует имена в ваш собственный (глобальный) пакет так, как если бы 
вы объявили их в основном тексте программы. В разделе «Таблицы символов» гла- 
вы 10 приведено описание механизма низкого уровня, действующего при импорте 
из одного пакета в другой; в главе 11 – описание настройки импорта и экспорта 
в модуле; в главе 16 — описание ВЕСТ\ и родственных ему СНЕСК, ІМІТ и Е№, которые 
тоже в некотором роде служат глобальными объявлениями, поскольку работа 
с ними происходит на этапе компиляции и может создавать глобальные эффекты. 


Объявления с областью видимости 


Как и глобальные объявления, объявления с лексической областью видимости 
оказывают воздействие на этапе компиляции. В отличие от глобальных объявле- 
ний, объявления с лексической областью видимости действуют только от точки, 
где находится объявление, до конца самой глубокой из охватывающих областей 
видимости (блока, файла или е\уа1 – что встретится раньше). Поэтому мы говорим: 
«с лексической областью видимости», хотя «с текстовой областью видимости» бы- 
ло бы, вероятно, точнее, поскольку «лексическая область видимости» имеет мало 
общего со словарями (лексиконами). Однако компьютерные специалисты во всем 
мире знают, что означает «лексическая область видимости» («ІехісаПу ѕсоред»), 
поэтому мы сохраняем здесь это название. 


Рей также поддерживает объявления с динамической областью видимости. Ди 
намическая область видимости (дупатіс зсоре) тоже распространяется до конца 
самого глубокого из охватывающих блоков, но в этом случае «охватывание» ди- 
намически определяется на этапе выполнения, а не текстуально, на этапе компи- 
ляции. Иными словами, динамическая вложенность блоков определяется вызо- 
вом одного блока другим, а не включением одного в состав другого. Эта вложен- 
ность динамических областей может отчасти коррелировать с вложенностью 
лексических областей, но, вообще говоря, они не идентичны, особенно если вы- 
зываются какие-либо подпрограммы. 


Мы уже говорили, что в некоторых отношениях и5$е можно рассматривать в каче- 
стве глобального объявления, но в других отношениях ие имеет лексическую об- 
ласть видимости. В частности, изе не только импортирует имена из пакета, но 
также реализует волшебные подсказки для компилятора, называемые прагма 
ми. Прагмы в большинстве своем имеют лексическую область видимости; к та- 
ким относится, например, директива ѕїгісї, которую мы время от времени упо- 
минаем. См. далее раздел «Прагмы». (Отсюда следует, что, если какая-то особен- 
ность языка окажется неявно включена прагмой изе \5.14 в начале файла, она 
будет действовать до конца файла, даже при переключении пакетов.) 


Объявление пакета (раскаде), как ни странно, имеет лексическую область видимо- 
сти, несмотря на то, что пакет представляет собой глобальный объект. Но объяв- 
ление пакета просто объявляет имя пакета по умолчанию для оставшейся части 
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охватывающего блока или, если вы включили после объявления раскаде МАМЕЗРАСЕ 
необязательный блок (В10СК), до конца этого блока. Поиск необъявленных иден- 
тификаторов! производится в этом пакете. В некотором смысле пакет вовсе и не 
объявляется, но начинает существовать, когда вы ссылаетесь на нечто, принад- 
лежащее этому пакету. Это вполне в духе Ре|. 


Объявления переменных с областью видимости 


Оставшаяся часть главы посвящена в основном использованию глобальных пере- 
менных. Или, скорее, тому, что не следует использовать глобальные переменные. 
Есть несколько объявлений, помогающих обойтись без глобальных переменных — 
или, по крайней мере, применять их разумно. 


Мы уже упоминали объявление раскаде, давным-давно введенное в Регі для целей 
распределения глобальных переменных по пакетам. Для некоторых типов пере- 
менных это работает довольно хорошо. Пакеты используются библиотеками, мо- 
дулями и классами для хранения данных своих интерфейсов (и некоторых своих 
полузакрытых данных), чтобы избежать конфликтов с одноименными перемен- 
ными и функциями в основной программе или других модулях. Так, запись 
ф5опте: :5ТиРЁ? означает, что автор обращается к скалярной переменной $5їиѓ? из па- 
кета Ѕопе. См. главу 10. 


Ограничься мы только этим, программы на Рег! по мере их развития быстро ста- 
новились бы громоздкими. К счастью, имеющиеся в Рег! три объявления области 
видимости позволяют легко создавать совершенно закрытые переменные (с помо- 
щью пу или э{а{е), предоставлять избирательный доступ к глобальным перемен- 
ным (посредством оџг) и обеспечивать временные значения для глобальных пере- 
менных (с использованием 10са1): 


ту $позе; 

оиг $Ноизе; 

ѕтате $1гоорегѕ = 0; 
1оса1 $ТУ сһаппе1; 


Если в объявлении более одной переменной, список должен быть заключен ь круг- 
лые скобки. 


пу ($поѕе, @еуез, %&ееїһ); 
оиг ($Ноизе, @Аџтоѕ, %К19$); 
ѕтаїте ($пате, $гапк, $зегпо); 
1оса1 (*5роиѕе, $рһопе{ НОМЕ} ); 


В объявлениях пу, ѕїаїе и `` допускаются только простые скалярные перемен- 
ные, переменные массивов и хешей, тогда как ѕтаїе позволяет инициализировать 
простые скалярные переменные (которые, впрочем, могут содержать ссылки на 
все, что угодно), но не массивы или хеши. Поскольку 10са1 – не настоящее объяв- 
ление, его ограничения не столь строгие: можно делать локальныме, с инициали- 
зацией или без нее, целые записи таблицы имен іуреғ1ор и отдельные элементы 


А также неквалифицированные имена подпрограмм, дескрипторов файлов, дескрип- 
торов каталогов и форматов. 


2 Или архаическую $50пе'ѕїиѓ?, использование которой за рамками поэзии на Рей не 
приветствуется. 
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или срезы массивов и хешей. Каждый из этих модификаторов имеет свой «режим 
заключения» модифицируемых переменных, Несколько упрощая, можно ска- 
зать, что оиг ограничивает область видимости имен, 10са1 ограничивает область 
видимости значений, а пу ограничивает область видимости, как имен, так и зна- 
чений. (Объявление ѕїаїе действует подобно объявлению пу, но несколько иначе 
понимает область видимости.) Каждой из этих конструкций может быть выпол- 
нено присваивание, хотя они различаются по тому, что фактически делают со 
значениями, поскольку имеют различные механизмы хранения значений. Они 
также несколько различаются, если вы не присваиваете (как было сделано вы- 
ше) им значений: объявление пу или 10са1 влечет присвоение указанным перемен- 
ным начальных значений џпіеѓ или (), в зависимости от типа, тогда как оџг остав- 
ляет текущее значение соответствующей глобальной переменной неизменным. 
А переменные, объявленные как ѕїаїе, получают значение, которое они имели 
при выполнении этого фрагмента кода в прошлый раз. 


Синтаксически, сиг, ѕїаїе и 10са1 являются просто модификаторами левосторон- 
него выражения, так что они похожи на прилагательные. Когда выполняется 
присваивание модифицированному таким образом ]-значению, модификатор не 
влияет на то, рассматривается ли 1-значение как скаляр или как список. Чтобы 
узнать, как будет работать присваивание, можно просто представить себе, что мо- 
дификатор отсутствует. Поэтому любой из вариантов 


ту ($00) = <5Т0ІМ№, 
пу @аггау = <5Т101№; 


предоставляет списочный контекст для правой части, в то время как 
пу $00 = <5ТОТ№>; 


предоставляет скалярный контекст. 


Модификаторы объявлений связывают аргументы более прочно (с более высоким 
приоритетом), чем запятая. В следующем примере ошибочно модифицируется 
одна, а не две переменных, поскольку список, следующий за модификатором, не 
заключен в круглые скобки. 


пу $Гоо. $Баг = 1; НЕВЕРНО 
Это равносильно следующему: 


ту $00; 
фраг = 1; 


Если действует прагма ѕігісї, Рей выдаст сообщение об ошибке, так как перемен- 
ная $баг оказывается необъявленной. 


В целом, лучше всего установить для переменной минимальную область видимо- 
сти, позволяющую эту переменную дельно применить. Поскольку переменные, 
объявленные в операторе управления логикой программы, видимы только в бло- 
ке, которым управляет этот оператор, их область видимости уменьшается. Благо- 
даря этому код становится еще и проще читать. 


ѕир спеск_магепоизе { 
Рог пу $міддес (оиг @Сиггепе_ Іпмепїогу) { 
зау "Сегодня у меня на складе есть Фмійде+. ": 
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Чаще всего встречается объявление пу, создающее переменные с лексической об- 
ластью видимости, имена и значения которых хранятся во временной памяти те- 
кущей области видимости и не доступны глобально. Всегда используйте пу, если 
только не знаете наверняка, зачем вам нужен иной модификатор. Аесли вы хоти- 
те обеспечить ту же степень закрытости переменной, но сохранить ее значение до 
следующего вызова, используйте ѕїаїе. 


Очень близко к этим двум объявление оиг, которое вводит в текущую область види- 
мости имя с лексической областью видимости, но при этом фактически ссылается 
на глобальную переменную, к которой при желании может обратиться каждый. 
Иными словами, это глобальная переменная, маскирующаяся под лексическую. 


Другая форма глобальной области видимости, динамическая область видимо- 
сти, применяется к переменным с модификатором 10са1, которые, несмотря на 
слово «оса», являются на самом деле глобальными переменными и не имеют ни- 
какого отношения к локальной временной памяти. (Имж їепр точнее отражало бы 
назначение этого модификатора, поскольку он временно меняет значение сущест- 
вующей переменной. В один прекрасный день вы можете даже увидеть слово {етр 
в программах на Регі 5, если мы заимствуем это ключевое слово из Рег 6.) 


Вновь объявленная переменная пу (или значение, в случае 10са1) недоступна до 
оператора, следующего после оператора, содержащего объявление. Благодаря это- 
му можно создать зеркальное отражение переменной, как показано ниже: 


пу $х = $х; 


Эта строка инициализирует новую внутреннюю переменную $х текущим значе- 
нием существующей переменной $х, где под существующей подразумевается пе- 
ременная $х в глобальной или лексической области видимости. 


Объявление имени лексической переменной скрывает ранее объявленную лекси- 
ческую переменную с тем же именем, которая объявлена в этой же или во внешней 
области видимости (хотя в этом случае можно получить предупреждение, если 
включен строгий режим). Оно также скрывает любую неквалифицированную гло- 
бальную переменную с тем же именем, но к глобальной переменной всегда можно 
обратиться, явно указав полное квалифицированное имя, включающее имя паке- 
та, например, $Раскадећапе::уагпате. 


Переменные с лексической областью видимости: ту 


Чтобы помочь избежать хлопот, связанных с поддержкой глобальных перемен- 
ных, Рен предоставляет переменные с лексической областью видимости, часто 
для краткости называемые лексическими (ехса13). В отличие от глобальных, 
лексические переменные гарантируют приватность. Если ссылки на эти перемен- 
ные не выставляются напоказ, что позволило бы манипулировать ими косвен- 
ным образом, можете быть уверены, что всякий доступ к этим закрытым пере- 
менным ограничен кодом в одной ограниченной, непрерывной области вашей 
программы, которую легко найти. В конце концов, потому мы и выбрали ключе- 
вое слово пу (мой). 


В последовательности операторов могут содержаться объявления переменных 
с лексической областью видимости. Такими объявлениями обычно предваряют 
последовательность операторов, но это не обязательное требование — вы можете 
просто украсить первое обращение к переменной объявлением пу (при условии, 
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что это объявление находится в самой внешней области использования перемен- 
ной). Помимо объявления имен переменных на этапе компиляции, эти объявле- 
ния действуют как обычные операторы на этапе выполнения: все они обрабаты- 
ваются внутри последовательности операторов, как если бы были обычными опе- 
раторами, а не объявлениями: 


ту $пате = "ёге", 
Ту @зТиРЕ = (°’саг”, "һоиѕе`, “сфиб”), 
ту ($уеһіс1е, $һоте, $1001) = @ѕї0иғҒ; 


Эти лексические переменные совершенно скрыты от всего мира за пределами не- 
посредственно охватывающей их области видимости. В отличие от ситуации с ди- 
намической областью видимости, создаваемой 10са1 (см. следующий раздел), лек- 
сические переменные скрыты от любых подпрограмм, вызываемых из их области 
видимости. Это верно даже в отношении той же самой подпрограммы, вызывае- 
мой из себя самой или из любого другого места: каждый экземпляр подпрограм- 
мы получает собственную «временную память» для лексических переменных. 
Однако подпрограммы, объявленные в области видимости лексической перемен- 
ной, видят эту переменную, как и любой другой код в этой области видимости. 


В отличие от области видимости блока, области видимости файла не могут быть 
вложенными; «охват», по крайней мере, текстуально, не имеет места. Если вы за- 
гружаете код из отдельного файла с помощью 00, гедџіге или иѕе, то код в этом 
файле не имеет доступа к вашим лексическим переменным, равно как и вы не 
имеете доступа к лексическим переменным из этого файла. 


Однако любая область видимости внутри файла (и даже сам файл) действует по 
правилам. Часто удобно иметь области видимости более широкие, чем определе- 
ния функций, так как это позволяет организовать совместный доступ к закры- 
тым переменным для ограниченного набора подпрограмм. Так создаются пере- 
менные, которые программист на языке С назвал бы статическими: 


{ 
ту $5Тате = 0; 


вир оп { $ѕтате = 1} 
зир оѓ? { $5Тате = 0 } 
ѕир +оддІе { $фэтате = ! $51аїе } 


} 


Оператор еуа1 5ТЛІМС тоже действует как вложенная область видимости, посколь- 
ку код в еуа1 может видеть лексические переменные вызвавшей его области (если 
их имена не скрыты идентичными объявлениями в собственной области видимо- 
сти еуа1). Аналогично анонимные подпрограммы могут обращаться ко всем лек- 
сическим переменным охватывающей их области видимости; когда это происхо- 
дит, их называют замыканиями (‹озигез).! Объединим эти два замечания: если 
блок выполняет еуа] над строкой и создает при этом анонимную подпрограмму, 
эта подпрограмма становится замыканием с полным доступом к лексическим пе- 


Мнемоническое правило основывается на общем элементе в «епсіоѕіпе ѕсоре» (охваты- 
вающая область видимости) и «с1юзиге» (замыкание). (В действительности определе- 
ние замыкания происходит от математического понятия, означающего полноту набо- 
ра величин и операции над этими величинами.) 
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ременным как е\а1, так и блока, даже после выхода из еуа1 и блока. См. раздел 
«Замыкания» главы 8. 


Лексические переменные, 
сохраняющие свое значение: ѕ$їаїе 


Переменная с декларацией ѕїаїе является лексической, подобно переменой ту. 
Единственное отличие в том, что ѕїаїіе-переменные никогда не инициализируют- 
ся повторно, в отличие от пу-переменных, которые инициализируются каждый 
раз, когда происходит вход в непосредственно охватывающий блок. Обычно пере- 
менные ѕїаїе используются с целью дать функции частную переменную, сохра- 
няющую свое значение между вызовами функции. 


Переменные ѕїаїе доступны, только если действует прагма изе Геа+иге “ѕїаїе". Она 
включается автоматически, если с помощью объявления изе указана версия Рей 
не ниже у5.10: 


узе У5. 14; 

ѕир пехЕ_соипт { 
ѕтаїе $соџпїег = 0; # инициализация выполняется тольке в первый раз 
гесигп ++фсоџпїег; 


} 


В отличие от переменных пу, переменные ѕїаїе в настоящее время могут быть 
только скалярными - они не могут хранить массивы или хеши. Это может пока- 
заться более серьезным ограничением, чем в действительности, ведь вы всегда 
можете сохранить в переменной вида ѕїаїе ссылку на массив или хеш: 


иѕе у5. 14; 
зтате $бад = 
ѕїате $уесїог = 


1 
= ^^ 


ип1евв ($6ад->{$ітет}) { $6а9-2{$1ет} = 1 } 


риѕћ @фуестог, ФіїТет, 


Глобальные объявления 
с лексической областью видимости: оиг 


В былые времена, до появления и3е 51г1сї, программы на Рег] могли напрямую 
обращаться к глобальным переменным. Объявление оиг являет собой более совре- 
менный метод такого доступа. Оно имеет лексическую область видимости, по- 
скольку действует только до конца текущей области видимости. Но, в отличие от 
лексической области видимости пу или динамической области видимости 10са1, 
сиг не изолирует ничего в текущей лексической или динамической области види- 
мости. Напротив, оно обеспечивает доступ к глобальной переменной в текущем 
пакете, маскируя одноименные лексические переменные, которые, в противном 
случае, закрыли бы от вас эту глобальную переменную. В этом отношении пере- 
менные оиг действуют точно так же, как переменные пу. 


Если поместить объявление оџг за пределами всех блоков, заключенных в фигур- 
ные скобки, оно действует до конца текущей единицы компиляции. Однако часто 
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его помещают в начале подпрограммы, чтобы указать на необходимость обраще- 
ния к глобальной переменной: 


ѕир спеск_магеһоџѕе { 
оиг @Сиггепї_Іпуепїогу: 
пу $и1одет; 
Тогеасн $іддеї (@Сиггеп{_Тиуептогу) { 
ѕау "Сегодня у меня на складе есть $міддеї. ` 


} 


Поскольку глобальные переменные живут дольше и видимы шире, чем закры- 
тые, мы предпочитаем использовать для них более длинные и броские имена, чем 
для временных переменных. Одно лишь это правило, если ему старательно следо- 
вать, может столь же успешно отбить охоту к работе с глобальными переменны- 
ми, как и использование и5е ѕігісі, особенно у тех, кто не особенно искусен в об- 
ращении с клавиатурой. 


Повторные объявления оиг не имеют контекста вложенности. Каждое вложенное 
пу создает новую переменную, а каждое вложенное 10са] создает новое значение. 
Но всякий раз, когда используется оиг, речь идет о той же самой глобальной пе- 
ременной, независимо от уровня вложенности. Если осуществляется присваива- 
ние переменной оиг, его результат сохраняет свое действие и после конца области 
видимости присваивания. Дело в том, что оиг не создает значений; оно просто пре- 
доставляет ограниченную форму доступа к глобальной переменной, срок жизни 
которой не ограничен: 


оиг ФРАОСВАМ_ МАМЕ = малфег“; 
{ 
сиг ФРВОСААМ МАМЕ = "зегуег”, 
# Вызываемый здесь код видит “зегуег“. 


} 


# Выполняемый здесь код по-прежнему видит "ѕегмег 


Сравните все это с тем, что происходит с гу или _2с2., когда за пределами блока 
наружная переменная или значение снова становятся видимыми: 


ту $1 = 10; 


{ 
пу $1 = 99; 


} 


# Компилируемый здесь код видит наружную переменную со значением 10. 


1оса] $РВОСВАМ_МАМЕ = "маіїег” 
{ 
10са1 $РВОСВАМ_МАМЕ = “зегуег“; 
# Код, выполняемый здесь, видит “зегуег” 


} 


$ Код, выполняемый здесь, снова видит “маз{ег”. 
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Обычно имеет смысл делать только одно присваивание в объявлении оуг, вероят- 
но, в самом начале программы или модуля, либо, реже, если вы предваряете оиг 
собственным 10са1: 


{ 
10са1 оиг @СиггепЕ_Тимепфогу = ом(Бапапаз); 
спеск_магеноизе(); # нет, бананов у нас нет :-) 
} 


(Но почему бы в этом случае просто не передать значение, как аргумент?) 


Переменные с динамической областью видимости: Іосаі 


Использование объявления 10са1 с глобальной переменной дает этой переменной 
временное значение при каждом выполнении 10са1, но не оказывает влияния на 
глобальную видимость переменной. Когда программа достигает конца текущей 
динамической области видимости, временное значение отбрасывается и восста- 
навливается первоначальное значение. Но сама переменная всегда остается гло- 
бальной, и всего лишь получает временное значение на период выполнения данно- 
го блока. Если вызвать какую-либо другую функцию в то время, когда эта гло- 
бальная переменная содержит временное значение, и внутри функции обратиться 
к данной глобальной переменной, функция увидит временное значение перемен- 
ной, а не первоначальное. Иными словами, эта другая функция находится в ва- 
шей динамической области видимости, хогя, предположительно, не в лексиче- 
ской области видимости.1 


Этот процесс называется образованием динамической области видимости, пото- 
му что текущее значение глобальной переменной зависит от динамического кон- 
текста — от того, кто из предков в цепочке вызовов применил оператор 10са1. Ина- 
че говоря, вызывающий программный код может полностью контролировать 
значение, которое вы увидите. 


Если вы встречаете объявление 10са1, которое выглядит так: 


{ 
1оса1 $уаг = Фпемуа1ие, 
зоте_Фипс(); 


} 


то можете представлять его себе исключительно в терминах присваиваний этапа 
выполнения: 


{ 
фо1дуа1ие = $маг 
фуаг = Фпемуа1ие; 
зоте_Рипс(); 


Вот почему лексические области видимости иногда называют статическими: чтобы 
противопоставить их динамическим областям видимости и подчеркнуть их детерми- 
нированность на этапе компиляции. Не путайте это значение термина с тем, которое 
слово «статический» имеет в С и С++. Этот термин слишком сильно перегружен значе- 
ниями, почему мы и стараемся его не использовать. 
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} 
сопїл1пие { 
фуаг = $01дуа1ше: 


} 


Разница в том, что при использовании 10са1 значение восстанавливается незави- 
симо от того, каким образом происходит выход из блока, даже если это досроч- 
ный возврат из данной области видимости. 


Как и в случае применения пу, можно инициализировать 10са1 копией той же са- 
мой глобальной переменной. Все изменения, происходящие с этой переменной во 
время выполнения подпрограммы (и всех других, вызываемых из нее, которые, 
разумеется, по-прежнему видят глобальную переменную с динамической обла: 
стью видимости), будут отброшены при возврате из подпрограммы. Конечно, луч- 
ше всего снабдить свои действия комментариями: 


# ПРЕДУПРЕЖДЕНИЕ: Изменения в этой динамической области видимости 
н являются временными 
10са1 $5оте б10ба1 = $5оте б1оба1; 


После этого глобальная переменная по-прежнему видна всюду в программе неза- 
висимо от того, была ли она явно определена с помощью оог или возникла из ни- 
чего, или содержит значение 10са1, подлежащее отбрасыванию при выходе из об- 
ласти видимости. В маленьких программках это не столь плохо, но в больших 
программах вы быстро потеряете возможность отслеживать, где в коде применя- 
ются все эти глобальные переменные. При желании можно запретить случайное 
использование глобальных переменных с помощью директивы џѕе ѕігісі `үагѕ’, 
описываемой в следующем разделе. 


Хотя и пу, и 10са1 предоставляют некоторую степень защиты, в целом предпочти- 
тельнее использовать пу, а не 10са1. Однако иногда применение 10са1 необходимо, 
чтобы временно изменить значение существующих глобальных переменных, на- 
пример, перечисленных в главе 25. Лексическую область видимости могут иметь 
только буквенно-цифровые идентификаторы, а многие из этих специальных пе- 
ременных не являются строго буквенно-цифровыми. Без :0721 также не обойтись 
при внесении временных изменений в таблицу имен пакета, как показано в раз- 
деле «Таблицы имен» главы 10. Наконец, можно распространить действие 10са1 
на один элемент или целый срез массива или хеша. Это допустимо, даже если 
массив или хеш являются лексической переменной, при этом режим динамиче- 
ской области видимости 10са1 накладывается поверх этих лексических перемен- 
ных. Мы не станем здесь больше распространяться о семантике 10са1. Дополни- 
тельные сведения можно получить из описания 10са1 в главе 27. 


Прагмы 


Многие языки программирования позволяют давать компилятору советы. В Ре] 
эти советы передаются компилятору посредством объявления изе. Вот некоторые 
из них: 


изе магпіпд$; 
изе ѕігісї; 
иѕе іпїедег; 
иузе буїеѕ; 


Прагмы Е = 183 


иѕе сопѕ+апї рі => ( 4 * аїап2(1, 1) ); 


Все прагмы Реті описаны в главе 29, но сейчас мы отдельно поговорим о некоторых 
из них, особенно полезных в связи с материалом, изложенным в данной главе. 


Хотя некоторые прагмы представляют собой глобальные объявления, воздейст- 
вующие на глобьльные переменные в текущем пакете, в большинстве своем это 
объявления с лексической областью видимости, действие которых продолжается 
только до конца охватывающего блока, файла или еуа! (в зависимости от того, 
что встретится раньше). Прагму с лексической областью видимости можно отме- 
нить во вложенной области видимости с помощью объявления по, которое дейст- 
вует как иѕе, но противоположным образом. 


Управление выводом предупреждений 


Чтобы показать, как это работает, мы поработаем с прагмой магп110$, указывая 
Рен, когда следует выводить предупреждения о сомнительных приемах програм- 
мирования: 


56 магпіпоѕ; # Включить вывод предупреждений отсюда и до конца файла 


по магп1п95; # Отключить вывод предупреждений до конца блока 


} 


# Здесь вывод предупреждений автоматически снова активизируется 


Когда вывод предупреждений включен, Рег! сообщает о переменных, использо- 
ванных только один раз; объявлениях переменных, скрывающих другие объяв- 
ления в той же области видимости; недопустимых преобразованиях строк в чис- 
ла; использовании неопределенных значений в качестве допустимых строк или 
чисел; попытках записи в файлы, открытые только для чтения (или вообще не 
открытые); и многих других ситуациях, описанных в разделе справочного руко- 
водства рей ая. 


Прагма магпіпоѕ — предпочтительный способ управления выводом предупрежде- 
ний. В старых программах этим целям служил ключ командной строки -м или 
состояние глобальной переменной $^И: 


{ 
1оса1 $ = 0; 


} 


Гораздо правильнее применять прагмы џѕе магпіпдѕ и по магп1пд$. Дело в том, что 
обработка прагмы выполняется на этапе компиляции, а сама прагма представля- 
ет собой лексическое объявление и, следовательно, не может влиять на код, на 
который не должно влиять, а кроме того (хотя мы не показали этого в наших про- 
стых примерах), позволяет тонко управлять отдельными классами сообщений. 
Дополнительные сведения о прагме магпіпд5, в том числе информация о том, как 
преобразовать просто надоедливые сообщения в фатальные ошибки и как переоп- 
ределить прагму, чтобы включить глобальный вывод предупреждений, даже ес- 
ли модуль требует обратного, можно найти в описании прагмы магп1пдз в главе 29. 
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Управление использованием глобальных переменных 


Еще одно распространенное объявление — многоцелевая прагма ѕігісї, одной из 
функций которой является управление использованием глобальных переменных. 
Обычно Рен позволяет создавать новые переменные (а нередко и «затаптывать» 
старые) путем простого их упоминания. По умолчанию, обтявлять переменные во- 
обще не требуется. Поскольку бесконтрольное применение глобальных перемен- 
ных может сделать мучительным сопровождение больших программ и модулей, 
иногда желательно воспрепятствовать случайному их использованию. Чтобы со- 
действовать предотвращению таких несчастных случаев. можно сказать: 


иѕе м5.14, н Включить ѕЁгісї неявно. 
иѕе зЕг1ст “уагз”, # Включить ѕЁгісі явно 


Это означает, что с данного места и до конца охватывающей области видимости 
все упоминаемые переменные должны относиться либо к лексическим перемен- 
ным, объявленным с помощью пу, ѕїаїе или оуг, либо к переменным, которые яв- 
ным образом разрешены глобально. В противном случае возникает ошибка ком- 
пиляции. Глобальная переменная считается явно разрешенной в одном из сле- 
дующих случаев: 


• это одна из специальных переменных Рей, действующих всюду в программе 
(см. главу 25); 


• она полностью квалифицирована именем своего пакета (см. главу 10); 
• она импортирована в текущий пакет (см. главу 11); 


» она маскируется под переменную с лексической областью видимости посред- 
ством объявления оиг (это основная причина. по которой мы ввели в Рег! объ- 
явления оиг). 


Конечно, всегда есть пятая альтернатива: если применение этой прагмы стано- 
вится обременительным, можно просто отменить ее во внутреннем блоке с помо- 
щью: 


по 5їгісї “уагз” 


Данная прагма позволяет также включить строгую проверку символического ра- 
зыменования и случайного использования «голых» слов. Обычно просто говорят: 


иѕе ѕїгісі; 


чтобы включить все три ограничения, если они еще не были включены объявле- 
нием изе \5.14 или подобным ему. Дополнительные сведения можно найти в опи- 
сании ѕїгісї в главе 29. 


Поиск по шаблону 


Встроенная в Ре! поддержка сопоставления с шаблоном обеспечивает удобный 
и эффективный поиск в больших объемах данных. Если вы управляете огромным 
коммерческим порталом, сканирующим все существующие ленты новостей в по: 
исках интересной информации; правительственной организацией, посвятившей 
себя анализу демографических данных (или генома человека); или же просто ра- 
ботаете в образовательном учреждении и пытаетесь организовать представление 
каких-то динамических данных на своем веб-сайте, идеальным инструментом 
для вас будет Регі – отчасти благодаря его возможностям работы с базами данных, 
но в большей степени благодаря возможностям поиска по шаблону. Если рассмат: 
ривать «текст» в самом широком смысле этого слова, то, вероятно, 90% всего, что 
мы делаем, на 90% состоит из обработки текста. Это действительно основной та- 
лант языка Рен, и так было с самого начала; он упоминается даже в самом назва- 
нии Ре": Ргасііса1 ЕхёгасНоп апа Керогі Гапсџоаре – практический язык извлече- 
ния данных и генерации отчетов. Шаблоны Рег! предоставляют мощный способ 
просмотра гор «сырых» данных с целью извлечения из них полезной информации. 


Шаблон задается путем создания регулярного выражения (гевщаг ехргеѕѕіоп, или 
гедех). Механизм регулярных выражений Ре! (в оставшейся части главы мы бу- 
дем называть его просто «Механизм») берет это выражение и определяет, соответ- 
ствует ли этот птаблон (и каким образом) вашим данным. Хотя чаще всего данные 
представляют собой текстовые строки, ничто не мешает применять регулярные 
выражения для поиска и замены в любых последовательностях байтов, включая 
и объекты, которые мы обычно считаем «двоичными» данными. Для Рег бай- 
ты — это просто символы, порядковые значения которых, по стечению обстоя- 
тельств, меньше 256. (Подробнее об этом рассказывается в главе 6.) 


Тех, кто уже сталкивался где-то с регулярными выражениями, мы должны пре- 
дупредить, что в Рег] регулярные выражения несколько иные. Во-первых, они не 
являются полностью регулярными в теоретическом смысле этого слова, посколь- 
ку их возможности значительно шире, чем у традиционных регулярных выраже- 
ний, которые преподаются в курсах вычислительной техники, Во-вторых, они 
так часто применяются в Регі, что имеют свои особые переменные, операторы 
и соглашения по использованию кавычек, тесно интегрированные с языком, а не 
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просто прицеплены к платформе языка, как сторонняя библиотека. Программи- 
сты, не имеющие опыта работы с Регі, нередко тщетно ищут функции для поиска 
и замены вроде таких: 


па+сһ( $$1г1п9, $раїїегп ); 
ѕирѕ%( $${г1п9, Фраеги, $геріасетепї ) 


Но поиск и подстановка в Ре! являются столь фундаментальными задачами, что 
заслужили быть представленными однобуквенными операторами: т/РАТТЕАМ/ 
и $/РАТТЕНМ/НЕРЕАСЕМЕМТ/, для краткости — п// и 5///. Эти операции не только имеют 
краткий синтаксис, но и анализируются не как обычные операторы, а как строки 
в двойных кавычках; тем не менее они действуют как операторы, и так мы и бу- 
дем их называть. На протяжении всей этой главы рассматривается применение 
этих операторов для поиска шаблонов в строке. Если какая-то часть строки согла- 
суется с шаблоном, то мы будем говорить, что поиск успешен. Если поиск успе- 
шен, можно выполнить массу интересных операций. В частности, в случае при- 
менения 5/// успешный поиск приводит к замене обнаруженной части строки тем, 
что было задано в качестве РЕРЕАСЕМЕКТ. 


Вся эта глава посвящена конструированию и применению шаблонов. Регулярные 
выражения Рег] – это мощное и невероятно выразительное средство. Поэтому они 
могут выглядеть устрашающе для того, кто попытается догадаться, что же в це- 
лом делает некий длинный шаблон. Но если суметь разбить его на части и знать, 
как Механизм эти части интерпретирует, можно понять действие любого регуляр- 
ного выражения. Нередко можно видеть, как сотня строк программы на С или 
Јауа выражается на Рег! регулярным выражением, состоящим из одной строки. 
Понять это регулярное выражение может оказаться несколько труднее, чем каж- 
дую отдельную строку длинной программы, но, с другой стороны, регулярное вы- 
ражение, возможно, будет значительно легче понять, чем длинную программу 
в целом. Просто имейте такие вещи в виду. 


Бестиарий регулярных выражений 


Прежде чем погрузиться в изучение правил интерпретации регулярных выраже- 
ний, рассмотрим несколько примеров. Большинство символов в регулярных вы- 
ражениях просто соответствуют самим себе. Если несколько символов выстрое- 
ны в ряд, они должны быть найдены, как и можно ожидать, в указанном поряд- 
ке. Поэтому если записать шаблон для поиска: 


/Егодо/ 


можно быть уверенным, что поиск будет успешным, только если строка содержит 
в каком-то месте подстроку "Егодо”. (Подстрока — это просто часть строки.) Соот- 
ветствие может находиться в любом месте строки, если только в нем рядом распо- 
ложены эти пять символов в указанном порядке. 


Другие символы не соответствуют самим себе, а некоторым образом «неправиль- 
но» ведут себя. Мы называем их метасимволами. (Все метасимволы ведут себя 
неправильно сами по себе, но некоторые из них настолько дурны, что «заража- 
ют» плохим поведением и соседние символы.) 


Вот эти хулиганы: 
ЕО) Е” $ * +? 
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Метасимволы на практике очень полезны и имеют в шаблонах особое значение; 
по ходу дела мы об этих значениях расскажем. Но хотим уверить читателя, что 
можно найти любой из этих символов и буквально, предварив его символом об- 
ратной косой черты. Обратная косая черта, в частности, сама является метасим- 
волом, поэтому для буквального поиска обратной косой черты нужно поместить 
обратную косую черты перед ней самой: \\. 


Как видите, обратная косая черта – это один из тех символов, которые провоци- 
руют неправильное поведение других символов. Отсюда следует, что, заставь мы 
непослушный символ вести себя неправильно, получим в результате послушание 
и хорошее поведение – иначе говоря, мы применяем двойное отрицание. Поэтому 
обратная косая черта перед символом превращает в буквальные лишь символы 
пунктуации; обратная косая черта перед (обычно хорошо воспитанным) буквенно- 
цифровым символом производит противоположный эффект: она превращает бук- 
вальный символ в нечто особое. Встретив двухсимвольную последовательность 
вроде этих: 


Мо Хо \+ \3 \5 


необходимо знать, что она является метасимволом, обозначающим что-то не- 
обычное. Например, \6 соответствует границе слова, а \ї – обычному символу та- 
буляции. Обратите внимание, что табуляция имеет размер в один символ, тогда 
как граница слова имеет ширину ноль символов, поскольку это место между дву- 
мя символами. Поэтому мы называем \6 утверждением нулевой ширины (гего- 
ил аззегНоп). Тем не менее, \ и \0 схожи: оба утверждают нечто о конкретном 
месте в строке. Утверждая что-либо в регулярном выражении, мы просто требу- 
ем, чтобы это нечто было истинным при соответствии шаблону. 


Большинство участков регулярного выражения представляют собой утверждения 
того или иного рода, при этом обычные символы просто утверждают, что они соот- 
ветствуют самим себе. Если сказать точнее, они утверждают также, что следую- 
щее по очереди соответствие участку регулярного выражения будет располагаться 
на один символ далее в строке, поэтому мы и говорим, что символ табуляции «име- 
ет ширину в один символ». Некоторые утверждения (такие, как \{) «съедают» 
в случае соответствия часть строки, в то время как другие (такие, как \0) не дела- 
ют этого. Но обычно мы используем термин «утверждение» только для утвержде- 
ний нулевой ширины. Чтобы избежать путаницы, мы будем называть нечто, об- 
ладающее шириной, атомом. (Если вы физик, можете представлять себе атомы 
с ненулевой шириной как имеющие массу, в противоположность утверждениям 
нулевой ширины, которые не имеют массы, как фотоны.) 


Мы увидим также, что некоторые метасимволы не являются утверждениями, 
а выполняют функцию структурирования (подобно тому, как фигурные скобки 
и точки с запятой определяют структуру обычного кода Рей, но не совершают ни- 
каких действий). Эти структурирующие метасимволы в некоторых отношениях 
являются самыми важными, поскольку при обучении чтению регулярных выра- 
жений решающий первый шаг состоит в том, чтобы приучить глаз выхватывать 
структурирующие метасимволы. После освоения этой премудрости чтение регу- 
лярных выражений становится легким, как дуновение ветерка.! 


і Временами, положим, ветерка довольно свежего, но не настолько, чтобы свалить с ног. 
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Один из таких структурирующих символов — вертикальная черта, обозначаю- 
щая перечисление (аПегпайоп): 


/Егодо | Р1ро1п|Меггу | Ѕат/ 


Этот шаблон означает, что обнаружение любой из этих строк делает поиск успеш- 
ным; об этом рассказывается в разделе «Перечисление» далее в этой главе. А в пред- 
шествующем ему разделе «Захват и группировка» мы покажем. как осушествлять 
группирование частей шаблона посредством круглых скобок: 


/(Егоао | 0годо | Ві10о) Вадд1п5/ 
или даже так: 
/(Егод | Ого і Ві10)о Ваддіпѕ/ 


Еще вы познакомитесь с так называемыми квантификаторами, которые указы- 
вают, сколько раз подряд должно быть найдено то, что им предшествует. Кванти- 
фикаторы выглядят так: 


+7? *7 + {3} {2,5} 


Однако они не встречаются в такой изоляции, как здесь. Квантификаторы имеют 
смысл, только когда прикреплены к атомам, т.е. утверждениям, обладающим 
шириной.! Квантификатор прикрепляется только к предшествующему атому; на 
человеческом языке это означает, что обычно он указывает количество повторе- 
ний только одного символа. Чтобы найти в строке три копии подстроки "Баг", сле- 
дующих подряд, нужно сгруппировать отдельные символы “баг” в одной «моле- 
куле» с помощью скобок, вот так: 


/(Баг){3}/ 


Этот шаблон будет соответствовать строке "багђагба"". Если бы вы сказали /баг{3}/, 
это соответствовало бы “баггг", что служило бы поводом отнести вас к шотланд- 
цам, и поставить под сомнение вашу принадлежность к барбарбарианцам. (Неко- 
торые из наших любимых метасимволов можно с уверенностью считать шотланд- 
скими.) Подробнее о квантификаторах читайте в разделе «Квантификаторы» да- 
лее в этой главе. 


Итак, вы посмотрели на некоторых бестий, обитающих в регулярных выражени- 
ях, и вам, вероятно, не терпится заняться их укрощением. Однако прежде чем 
заняться серьезным обсуждением регулярных выражений, надо вернуться не- 
много назад и поговорить об операторах поиска по шаблону, использующих регу- 
лярные выражения. (И если по дороге вам случится обнаружить еще несколько 
зверюшек из регулярных выражений, оставьте приличные чаевые своему гиду.) 


' Квантификаторы немного похожи на модификаторы операторов, описанные в главе 4, 
которые могут прикрепляться только к самостоятельным операторам. Прикрепление 
квантификатора к утверждению нулевой длины было бы похоже на попытку прикре- 
пить модификатор ие к объявлению - и то и другое несет не больше смысла, чем поп- 
росить у аптекаря килограмм фотонов. Аптекарь сможет взвесить только атомы и все 
такое прочее. 
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Операторы поиска по шаблону 


Раз уж мы развиваем метафору зоопарка, можно сказать, что операторы Ре! для 
поиска по шаблону действуют как своего рода крепкие клетки для регулярных 
выражений. Дело в том, что если выпустить зверюшек из семейства регулярных 
выражений на просторы языка, Ре! может превратиться в настоящие джунгли 
Конечно, миру нужны джунгли - в конце концов, они поддерживают биологиче- 
ское многообразие — но джунгли должны находиться там, где им положено. Ана- 
логично, двигатель комбинаторного многообразия, регулярные выражения, дол- 
жен оставаться внутри операторов поиска по шаблону, где его место. Там нахо- 
дятся джунгли. 


Казалось бы, регулярные выражения и без того мощные, однако операторы п// 
и 5/// дополняют их еще и мощью интерполяции двойных кавычек (аналогичным 
образом ограниченной). Поскольку шаблоны анализируются как строки в двой- 
ных кавычках, действуют все обычные соглашения для двойных кавычек, в том 
числе интерполяция переменных (если только в качестве ограничителя не ис- 
пользуются одинарные кавычки) и специальные символы, обозначаемые с помо- 
щью обратной косой черты. (Подробнее - в разделе «Специальные символы» да- 
лее в этой главе.) Эти соглашения выполняются до того, как строка интерпрети- 
руется в качестве регулярного выражения. (Это одна из редких для Реп ситуа- 
ций, когда обработка строки производится более чем в один проход.) Первый 
проход представляет собой не совсем обычную интерполяцию строки в двойных 
кавычках, поскольку некоторые части строки следует интерполировать, а неко- 
торые — просто передать анализатору регулярных выражений. Поэтому, напри- 
мер, символ $, сразу за которым следует вертикальная черта, закрывающая круг- 
лая скобка или конец строки, будет обрабатываться не как интерполяция пере- 
менной, а как обычное утверждение регулярного выражения, означающее конец 
строки. Поэтому, если сказать: 


$Ғоо = “Баг”; 
/$#00$/: 


то на этапе интерполяции Регі будет понимать, что эти два символа $ имеют раз- 
личное назначение. Поэтому он выполнит интерполяцию $100 и передаст анали- 
затору регулярных выражений следуюшее: 


/баг$/; 


Другим следствием этого двухпроходного анализа является то, что стандартный 
механизм разбора на лексемы в Рег! сначала находит конец регулярного выраже- 
ния, совсем как если бы искал завершающий ограничитель для обычной строки. 
Только после того, как найден конец строки (и завершена интерполяция всех пе- 
ременных), шаблон рассматривается как регулярное выражение. Помимо всего 
прочего, это означает, что нельзя «скрыть» завершающий ограничитель внутри 
конструкции регулярного выражения (такой как класс символов или коммента- 
рий в регулярном выражении, о которых мы еще расскажем). Рей увидит огра- 
ничитель, где бы он ни был, и закончит шаблон в этом месте. 


Следует также знать, что интерполяция внедренных в шаблон переменных, зна- 
чения которых постоянно меняются, замедляет работу механизма сопоставления 
с шаблоном, если ему приходится заново компилировать шаблон. См. раздел «Ин- 
терполяция переменных» далее в этой главе. Вы можете насильственно подавить 
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повторную компиляцию с помощью модификатора /о (014 – старый), но обычно 
лучше вынести изменяющиеся части за пределы шаблона посредством конструк- 
ции 9г//, чтобы повторной компиляции подвергалась только та часть, которую 
действительно необходимо скомпилировать повторно. 


Оператор транслитерации! {г/// не производит интерполяцию переменных и да- 
же не задействует регулярные выражения! (На самом деле ему, возможно, вообще 
не место в этой главе, но лучшего места для него мы не нашли.) Однако у него есть 
одна общая черта с п// и 5///: он выполняет привязку к переменным с помощью 
операторов =- и !-. 

Операторы =- и !-, описанные в главе 3, привязывают скалярное выражение из 
своей левой части к одному из трех операторов типа кавычек, находящихся в пра- 
вой части: п// для поиска по шаблону, 5/// для подстановки некоторой строки вме- 
сто подстроки, сопоставленной с шаблоном, и 1г/// (или синоним - у///) для транс- 
литерации (замены) одного набора символов другим. (Можно также записывать 
п// как //, без т, если в качестве ограничителя выступает косая черта.) Если в пра- 
вой части оператора =- или !- находится нечто отличное от этих трех операторов, 
оно все равно рассматривается как операция поиска п//, но при этом не остается 
места для каких-либо замыкающих модификаторов (см. далее раздел «Модифи- 
каторы шаблонов»), и вам придется обрабатывать свои собственные кавычки: 


зау “соответствует” і? фѕотеѕїігіпо =- $зотера+егп; 
На самом деле нет оснований, чтобы не написать это явно; 
зау "соответствует" 1! $ѕотеѕігіпо =- п/фѕотераїтегп/, 


В операциях сопоставления операторы =- и !- иногда читаются. как «подходит» 
(таёсһез) и «не подходит», соответственно (хотя пара «содержит»/«не содержит» 
создавала бы не так много путаницы). 


Регулярные выражения в Рег фигурируют еще в паре мест, помимо операторов 
п// и 5///. Первый аргумент функции $р11{ является особым оператор сопоставле- 
ния, определяющим, что не должно возвращаться при разбиении строки на не- 
сколько подстрок. Описание и примеры применения $р111 даются в главе 27. Опе- 
ратор дг// («ацофе геуех» — заключить в кавычки регулярное выражение) тоже 
задает шаблон посредством регулярного выражения, но выполняет сопоставле- 
ние (в отличие отп//, который это делает). Вместо этого дг// возвращает скомпили- 
рованную форму регулярного выражения, которую можно использовать в даль- 
нейшем. Дополнительные сведения можно найти в разделе «Интерполяция пере- 
менных» данной главы. 


Один из операторов п//, $/// или 1г/// можно применить для конкретной строки по- 
средством оператора привязки =- (который, в сущности, является не оператором, 
а некоторым «тематизатором», рассуждая в терминах лингвистики). Вот несколь- 
ко примеров: 


$һауѕ+аск =- п/пеед1е/ # поиск по простому шаблону 
фпаузтаск =- /пее@1е/ # то же 


{гапзШегаЙоп орегафог — обычно переводят как «оператор замены», но термин «транс- 
литерация» в данном случае точнее отражает суть происходящего, поскольку указы- 
вает на побуквенную замену. — Прим. перев. 
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$іта1іапо =- з/вбиег/о11уе о11/ # полезная для здоровья замена 


$готате13 =- 1г/а-2А-7/п-2а-п\-2А-М/ # простое (для раскрытия) шифрование 


В отсутствие оператора привязки в качестве «темы» неявным образом использу- 
ется переменная $ : 


/пем 1іҒе/ апа # искать в $_ и (если найдена) 

/пем сіуі1ігға+іопѕ/ ў смело снова искать в $ 
ѕуѕидаг/аѕрагіате/ # заменить “сахар” на заменитель" в $_ 
Ег/АТСб/ ГАбС/ # дополнить цепочку ДНК в $_ 


Поскольку 5/// и 1г/// изменяют скалярные значения, к которым применяются, 
их можно использовать только с допустимыми левыми значениями: 


‘опзноге” =- з/оп/о{ ТИ; # НЕВЕРНО: ошибка этапа компиляции 
Однако п// работает с результатом любого скалярного выражения: 


іР ((1с $тадіс һатс->Ғесһ _сопепт$->аз_34г1п9) =- /габрі+/) { 
ѕау "Э-эй, док, какие дела? "; 

} 

е1зе { 
зау “Этот фокус никогда не срабатывает! “; 


} 


Но следует проявлять некоторую осторожность, поскольку =- и !· имеют доста- 
точно высокий приоритет: в предшествующем примере пришлось заключить ле- 
вый терм в круглые скобки.? Оператор привязки !- действуег подобно =-, но меня- 
ет логический результат операции на противоположный: 


ТЕ ($3019 !- /могдз/) { 
ѕау 99/Похоже, что”$з0пд” является песней без слов. / 


} 


Поскольку п//, $/// и {г/// являются операторами цитирования, мы можем выбрать 
собственные ограничители в качестве кавычек. Они действуют так же, как опера- 
торы 4//, 99//, 9г// и дм// (см. раздел «Выберите собственные кавычки» в главе 2). 


фраїћ =- ѕй/ітр#/маг/ітр/ѕсгаїсћ#, 


1# ($01г =- т[/01п]) { 
ѕау “Пожалуйста. без каталогов исполняемых программ. "; 


} 


Если в $/// или 1г//' используются парные ограничители, и пара в первой части 
является одной из традиционных (угловые, круглые, квадратные или фигурные), 
то для второй части можно выбрать ограничители, отличающиеся от выбранных 
для первой: 


1 Если не используется модификатор /т, возвращающий результат замены как г-значение. 


2 В отсутствие скобок имеющая более низкий приоритет функция 1с применяется ко 
всему шаблону поиска, а не только к вызову метода объекта «волшебный цилиндр». 
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3(е99)<1агма>; 
${1агуа} {рира}; 
ѕ[рира }/ітадо/: 


Перед открывающими ограничителями допустимы пробельные символы: 


$ (едд) <агма>, 
$ {1агуа} {рира}; 
$ [рира] /ітадо/; 


Всякий раз, когда поиск по шаблону оказывается успешным (в том числе при за- 
мене по шаблону), переменные $, $8 и $ устанавливаются равными тексту слевғ 
от найденного соответствия, всему соответствию и тексту справа от соответствия. 
Это удобно для разделения строк на части: 


оё сгоѕѕ Бипз” =- /сгоѕ5/; 

ѕау “Найдено. <$`> $& <$'>"; # Найдено: <һої > сгоѕѕ < Бипз> 
ѕау “Слева: <$`>“; н Слева: <һої > 

ѕау “Соответствие` <$&>"; # Соответствие” <сго$$> 

ѕау "Справа <$’>”; ғ Справа: < бипѕ> 


Детализацию и эффективность можно увеличить при помощи скобок, позволяю- 
щих захватывать отдельные участки того, что требуется сохранить. Каждая пара 
круглых скобок захватывает подстроку, соответствующую подшаблону, заключен- 
ному в эти скобки. Пары скобок нумеруются слева направо в соответствии с пози- 
циями левых скобок; подстроки, соответствующие этим подшаблонам, после окон- 
чания поиска доступны как пронумерованные переменные $1, $2, $3 и так далее 


$_ = "Бильбо Бэггинс родился 22 сентября“; 
/(.*) родился (.*)/; 

ѕау “Имя: $17; 

ѕау "Дата: $2"; 


Переменные $, $8, $, а также нумерованные переменные являются глобальны- 
ми, неявно локализованными в охватывающей динамической области видимо- 
сти. Их значения сохраняются до очередного успешного поиска по шаблону или 
до конца текущей области видимости — что наступит раньше. Подробнее об этом 
потом, в другой области видимости. 


Когда только Рен обнаруживает, что где-то в программе использована одна из пе- 
ременных, $, $& или $', то начинает создавать их при каждом поиске по шаблону. 
Это несколько замедляет выполнение программы. Аналогичный механизм ис- 
пользуется в Реп для создания переменных $1, $2 и так далее, поэтому приходит- 
ся платить и за каждый шаблон, содержащий сохраняющие скобки. (В разделе 
«Несохраняющая группировка» мы расскажем, как избежать издержек захвата. 
соответствий при сохранении режима группирования.) Но если ни разу не ис- 
пользовать $`, $& или $', то шаблоны без сохраняющих скобок штрафом не облага- 
ются. Поэтому обычно лучше избегать применения $, $& и $, если есть такая воз- 
можность, особенно в библиотечных модулях. Но если вы хоть раз их использова- 
ли (а в некоторых алгоритмах это действительно удобно), то можете дальше уже 
не особенно стесняться, поскольку за все заплачено. В последних версиях Рег] пе- 
ременная $& требует меньших расходов, чем две другие. 


1 Переменная $0 в их число не входит, поскольку хранит имя программы. 
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Более удачная альтернатива заключается в использовании модификатора /р, об- 
суждаемого ниже. Он сохраняет соответствия так, что переменные ${^РВЕМАТСН}, 
Ф{7МАТСН) и ${7РОЅТМАТСН} содержат то, что могли бы содержать переменные $', $8 
и $, но штрафуется при этом не вся программа, а только текущее регулярное вы- 
ражение. 


Модификаторы шаблонов 


Мы обсудим отдельные операторы поиска по шаблону буквально через мгнове- 
ние, но сначала хотелось бы рассказать еще об одном общем знаменателе: модифи- 
каторах. 


Сразу за последним ограничителем оператора п//, 5///, аг//, у/// или 1г/// можно по- 
местить один или несколько необязательных односимвольных модификаторов, 
в произвольном порядке. Для большей ясности модификаторы обычно пишутся 
как «модификатор /1» и произносятся «модификатор слеш ай», даже если в каче- 
стве закрывающего ограничителя используется не косая черта. (Иногда говорят 
«флаг» или «ключ», имея в виду «модификатор»; это тоже приемлемо.) 


Некоторые модификаторы изменяют режим действия отдельного оператора, под- 
робно мы опишем их позже. Другие изменяют порядок интерпретации регуляр- 
ного выражения, и мы поговорим о них сейчас. Операторы п//, $/// и 0г//! — все 
принимают модификаторы, перечисленные в табл. 5.1, после своего конечного ог- 
раничителя: 


Таблица 5.1. Модификаторы регулярных выражений 


Модификатор | Значение 


/1 Игнорировать различия в регистре символов 

/3 Позволить символу . соответствовать переводу строки 

Ин Позволить символам ? и $ соответствовать позиции рядом с внедренным 
символом /п 

/х Игнорировать (большинство) пробельных символов и разрешить коммен- 


тарии в шаблоне 


/о Компилировать шаблон только один раз 
Поддерживать переменные ${7РАЕМАТСН}, ${^МАТСН} и ${7РОЅТМАТСН} 


Двойной режим работы с набором символов АЗСП-Юникод (прежний ре- 
жим по умолчанию) 


/а Режим работы с набором символов АЗСИ 
/и Режим работы с набором символов Юникода (новый режим по умолчанию) 
д Режим работы с набором символов, определяемым региональными на- 


стройками времени выполнения (режим по умолчанию при использова- 
нии прагмы изе 10са1е) 


Модификатор /1 указывает, что соответствие символов устанавливается незави- 
симо от их регистра, т.е. поиск выполняется без учета регистра символов. Этот 


1 Оператор 11/// не позволяет использовать регулярные выражения, поэтому к нему не- 
применимы эти модификаторы. 
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процесс также называется сверткой регистра (сазео та). Это означает, что 
шаблону будут соответствовать не только символы верхнего и нижнего регистров, 
но и заглавного регистра (в английском языке такого регистра нет). Поиск без уче- 
та регистра символов также необходим, когда символы имеют несколько вариан- 
тов в одном и том же регистре, как, например, символ «сигма» в греческом алфа- 
вите: заглавной букве «У» обычно соответствует строчная «с», которая в конце 
слова превращается в «с». Например, греческое слово 21000 («Сизиф») содержит 
все три символа «сигма». 


Поскольку сопоставление без учета регистра символов выполняется посимвольно 
и не зависит от языка! соответствие может обнаруживаться в строках, имеющих 
неправильное начертание в том или ином языке. Например, /рег1/1 совпадет не 
только со строкой "ре!1", но также найдет соответствие в строках "ргоРЕТу" и "регі і- 
тег", хотя таких слова нет в английском языке. Аналогично и шаблон на /сісофос/і 
на греческом может совпасть не только со словами «У ІУТФОЎ» и «>160фос», но так- 
же с неправильно записанным словом «с160фос», в котором первая и вторая сиг- 
мы в нижнем регистре поменялись местами. 


Тоесть, даже при том, что мы идентифицировали наши строки, как текст на анг- 
лийском или греческом языке, Рег! совершенно не в курсе этого. Он просто вы- 
полняет поиск без учета регистра символов, игнорируя любые особенности язы: 
ка. Поскольку свертка всех возможных регистров одной и той же буквы приводит 
к одному и тому же результату, все они обнаруживаются шаблоном. 


Так как Рег! поддерживает только 8-битные наборы символов в региональных на- 
стройках, свертка регистров символов с кодовыми пунктами ниже 256 выполня- 
ется с применением текущей таблицы символов, а символов с большими значе- 
ниями кодов используются правила Юникода. Сопоставление без учета регистра 
символов в рамках региональных настроек не может преодолеть границу 255/256, 
при этом могут накладываться и другие ограничения. 


Модификаторы /з и /п не связаны с какими-либо извращениями. Они изменяют 
способ, которым Рег] осуществляет поиск в строке, содержащей символы перево- 
да строки. Важно не то, присутствует ли действительно символ ‘1 в анализируе- 
мой строке, а следует ли Рей считать, что последовательності символов содер- 
жит одну строку (/з) или несколько ( т), поскольку некоторые метасимволы по- 
разному действуют - в зависимости от того, предполагается ли их использование 
в режиме, ориентированном на строки, или нет. 


Обычно метасимвол (точка) соответствует любому символу, кроме символа пе- 
ревода строки, потому что традиционно он предназначается для поиска символов 
в одной строке текста (іпе). Однако при наличии модификатора /5 метасимвол `.' 
может соответствовать и символу перевода строки, поскольку этот модификатор 
сообщает Рей о необходимости игнорировать то обстоятельство, что последова- 
тельность символов может содержать символы перевода строки. Если необходи- 
мо предотвратить соответствие метасимвола “.” символу перевода строки при ис- 
пользовании модификатора /5, просто используйте класс символов \№, который 
означает то же, что и [^\п], но проще в наборе с клавиатуры. 


1 Или почти не зависит. Мы не хотели бы обсуждать проблему с символом «1» в турец- 
ком алфавите, поэтому не будем этого делать. 
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Напротив, модификатор /п изменяет интерпретацию метасимволов ^ и $, позво- 
ляя им соответствовать позициям рядом с символами перевода строки внутри 
текста, а не только по концам строки (модификатор /п может отключать оптими- 
зации, предполагающие поиск в пределах одной строки текста, а не по всему тек- 
сту, поэтому не применяйте его бездумно). Примеры приводятся в разделе «Пози- 
ции» далее в этой главе. 


Модификатор /р включает поддержку сохранения текста соответствия в специаль- 
ной переменной ${7МАТСН}; текста, предшествующего соответствию, ь переменной 
${РАЕМАТСН}; и текста, следующего за соответствием, в переменной ${7РОЅТМАТСН). 


Ныне почти окончательно устаревший модификатор /о управляет перекомпиля- 
цией шаблона. В настоящее время длин& шаблона должна превышать 10 Кбайт, 
чтобы выгода от применения этого модификатора стала хоть сколько-нибудь за- 
метной, поэтому данный модификатор можно считать пережитком прошлого. Тем 
не менее, вы можете столкнуться с ним в старом программном коде, поэтому по- 
смотрим, как он действует. 


За исключением случаев, когда ограничителями служат одинарные кавычки 
(т'РАТТЕВМ', ѕ'РАТТЕВМ'ПЕРІАСЕМЕМГ` или аг`РАГТЕЙМ"), все переменные в шаблоне интер- 
полируются при каждом вычислении оператора шаблона. В худшем случае вы- 
полняется полная перекомпиляция шаблона, а в лучшем дело ограничивается 
сравнением строки с целью определить необходимость перекомпиляции. Чтобы 
шаблон компилировался один и только один раз, используйте модификатор /о. 
Это позволяет избежать дорогостоящей перекомпиляции на этапе выполнения 
и полезно, если интерполируемое значение во время выполнения не меняется. Од- 
нако модификатор /о – это еще и обещание не изменять переменные, входящие 
в шаблон. Если же они все-таки изменятся, Ре! не обратит на это никакого внима- 
ния. Лучшее управление перекомпиляцией достигается при использовании опера- 
тора цитирования регулярных выражений, 0г//. Подробности читайте далее в этой 
главе, в разделе «Интерполяция переменных». 


Модификатор /х является экспрессивным: он позволяет эксплуатировать про- 
бельные символы и пояснительные комментарии в целях улучшения понятности 
вашего шаблона и даже экспансии шаблона через границы символов перевода 
строки. 


Это означает, что /х изменяет значение пробельных символов (и символа #): вместо 
того чтобы при поиске «притвориться» обычными символами, они превращаются 
в метасимволы, которые, как ни странно, ведут себя в результате так, как и долж- 
ны пробельные символы (и символ комментария). Следовательно, благодаря /х 
пробелы, символы табуляции и перевода строки используются для форматиро- 
вания, как в обычном коде Рец. Также благодаря этому модификатору за симво- 
лом #, обычно не являющимся в шаблоне каким-либо особенным, можно разме- 
щать комментарии, продолжающиеся до конца текущей строчки (Нпе) в шаблоне.) 
Если действительно потребуется найти пробельный символ (или символ #), при- 
дется поместить его в класс символов, либо экранировать его обратной косой чер- 
той, либо выразить его соответствующим восьмеричным или шестнадцатеричным 


Следите, чтобы в комментарий не попал ограничитель шаблона, ведь следуя своему 


правилу «сначала найти конец», Реп не сможет определить, что вы не собирались за- 
кончить шаблон в этом месте. 
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кодом. (Но обычно поиск пробельных символов осуществляется утверждениями 
\5* или \5+, поэтому на практике такая ситуация возникает редко.) 


Совместное применение этих функций значительно способствует превращению 
обычных регулярных выражений в доступный для чтения язык. В соответствии 
с духом ТМТОУГТИГ теперь есть больше одного способа записи данного регуляр- 
ного выражения. На самом деле их больше двух: 


т/\м+: (\5+\м+)\$*\9+/: # Слово, двоеточие, пробел, слово, пробел, цифры 
тЛи+: (\3+ \м+) \3* \0+/х: # Слово, двоеточие, пробел, слово, пробел, цифры 


п 

Найти слово и двоеточие. 

(начало сохраняющеи группы) 

Найти один или несколько пробелов 
Найти еще одно слово 

(конец сохраняющей группы) 

Найти ноль или несколько пробелов. 
Найти несколько цифр 


\м+: 
( 
\5+ 
\м+ 
) 
\5* 
\9+ 


Еее += 


х; 


Эти новые метасимволы мы опишем ниже. (Данный раздел мы хотели посвятить 
модификаторам шаблонов, но, впав в экстаз по поводу /х, не смогли удержаться 
в заданных рамках.) Вот регулярное выражение, отыскивающее повторяющиеся 
слова в абзацах и украденное прямо из «Ре. Библиотека программиста». В нем 
используются модификаторы /хи /1, атакже модификатор /0, который будет опи- 
сан ниже. 


# Найти в абзацах повторяющиеся слова, возможно, пересекая границы строчек 
# Применяется /х для пробелов и комментариев, /1 для поиска обоих `15' 
# в “Іѕ 1$ 111$ ок?", и /9 для поиска всех дубликатов 
$/ = ""; # режим рагадгер 
мһі1е (<>) { 
мһі1е ( п 
\6 # начать с границы слова 
(\м\5+) ф найти похожий на слово фрг =мент 
( 
\$+ # отделенный каким-нибудь пробелом, 
\1 Ни еще раз этот же фрагмент. 
) + # Повторять, сколькс возможно, 
\Б # до следующей границы слова 
хід 


ѕау "повтор слова `$1° в абзаце $ 


} 
Если применить этот код к данной главе, можно получить что-то вроде: 
повтор слова '`їһаї` в абзаце 150 


В данном случае мы знаем, что это повторение является преднамеренным. 


Модификатор /и включает использование семантики Юникода при сопоставле- 
нии. Он устанавливается автоматически, если шаблон представлен в кодировке 
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ОТЕ-8 или был скомпилирован в области действия прагмы изе Теафиге “ип1соде. 
ѕ1гіпуѕ” (а также не был скомпилирован в области действия старой прагмы изе 
1оса1е или изе Бу{ез, каждая из которых не рекомендуется к использованию). 


В области действия модификатора /и символы с кодовыми пунктами 128-255 
(т.е. между 128 и 255 включительно) интерпретируются как символы из набора 
150-8859-1 (Гайпт-1), и соответствуют символам с теми же кодами Юникода. Без мо- 
дификатора /и метасимвол \м в строках, имеющих кодировку, отличную от ОТЕ-8, 
точно соответствует символам [А-7а-20-9_] и ничему больше. С модификатором /и 
метасимвол \м в строках, имеющих кодировку, отличную от ОТЕ-8, также соответ- 
ствует всем «буквам» Гайп-1 с кодовыми пунктами в диапазоне 128-255, а имен- 
но: символу МІСВО “См п, двум индикаторам единиц измерения, 2 и °, и 62 латин- 
ским буквам. (В строках ОТЕ-8 метасимвол \м также соответствует всем этим 
символам.) 


Модификатор /а изменяет действие метасимволов \д, \5, \ми РОЅІХ-классов симво- 
лов так, чтобы они соответствовали только символам из набора АЗСП. Эти мета- 
символы обычно соответствуют кодам Юникода, не обязательно входящим в диа- 
пазон АЗСП. Однако в области действия модификатора /а метасимвол \0 соответ- 
ствует только десяти цифрам АЗСП, от «0» до «9», \ѕ соответствует только пяти 
пробельным символам АЗСПИ [ \#\г\г\], а \м соответствует только 63 «буквам» 
АЗСП [А-7а-20-9_]. (Это касается также метасимволов \6 и \В, поскольку они опре- 
деляются через метасимвол \м.) Точно так же все РОЅІХ-классы вроде [[:ргіпї:]] 
соответствуют символам АЗСП только в области действия модификатора /а. 


Кое-чем модификатор /г намного больше походит на /и, чем можно было бы поду- 
мать: он не гарантирует, что символам АЗСП будут соответствовать только сим- 
волы АЗСП. Например, согласно правилам свертки регистра в Юникоде, все сим- 
волы — «З», «3» и «Г» (0+017Е ТАТІ $МАЫ, ГЕТТЕВ ГОМС 8) — будут соответствовать 
друг другу при сопоставлении без учета регистра символов, так же как и символы 
«К», «К» и 0+212А КЕГУ!М 6903, «К». Запретить такое причудливое поведение ме- 
ханизма свертки регистра в Юникоде можно, продублировав модификатор: /аа. 


Модификатор /1 вынуждает механизм сопоставления с шаблоном использовать те- 
кущие региональные настройки. Под «текущими региональными настройками» 
здесь подразумеваются настройки, действующие на момент сопоставления, а не 
действовавшие на момент компиляции шаблона. В системах, поддерживающих 
такую возможность, текущие региональные настройки могут изменяться с помо- 
щью функции 5е11оса1е из модуля РОЗТХ. Этот модификатор действует автомати- 
чески для шаблонов, скомпилированных в области действия прагмы "изе 1оса1е“. 


Рег поддерживает только региональные настройки с наборами однобайтных 
символов. Это означает, что кодовые пункты со значениями выше 255 интерпре- 
тируются как символы Юникода, независимо от текущих региональных настро- 
ек. В соответствии с правилами Юникода, при поиске без учета регистра симво- 
лов механизм сопоставления может перешагивать границу однобайтных симво- 
лов между значениями кодовых пунктов 255 и 256, но модификатор /1 из необхо- 
димости запрещает такое поведение. 


1 Когда мы говорим о наборе символов АЗСП, все, кто по-прежнему используют набор 


ЕВСГС, должны в уме делать соответствующую подстановку во время чтения. Под- 
робнее о наборе ЕВСПІС рассказывается в электронной документации Рен. 
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Это обусловлено тем, что в некоторых национальных алфавитах символам назна- 
чаются кодовые пункты, не совпадающие с кодами символов в Юникоде (исклю- 
чение составляет набор 130-8859-1). По этой причине, например, национальный 
символ с кодом 255 не совпадает при поиске без учета регистра с символом, имею- 
щим код 376, +0178 т.АТИМ САРЕГАТ, ТЕТТЕВ У УЛТН ГЛАЕВЕЗ1$ (Ў), так как код 255 
может не соответствовать символу 0--00ЕЕ Г.АТГМ МАШ, ГЕТТЕВ У ҰІТН ГЛАЕКЕЗ$ (у) 
в текущем национальном алфавите. В Рег! отсутствует механизм, с помощью ко- 
торого можно было бы определить, существует ли требуемый символ в текущем 
наборе символов, а уж тем более, какой у него может быть код. 


Модификатор /и включается по умолчанию, если вы явным образом предписали 
набора особенностей Рег версии у5.14. В противном случае существующий про- 
граммный код будет действовать как прежде, как если бы вы использовали моди- 
фикатор /4 в каждом шаблоне (или /1, в области действия изе 1оса1е). Это гаран- 
тирует обратную совместимость, а также обеспечивает более элегантный способ 
реализации функций в будущем. Традиционно механизм сопоставления с шаб- 
лонами в языке Ре! демонстрирует двойственное поведение, откуда и взялось на- 
звание модификатора /0 (Поа — двойственный), которое можно также перевести, 
как «Ц дерепаз» (в зависимости от обстоятельств). В области действия модифика: 
тора /4 правила сопоставления определяются набором символов, используемым 
платформой, если нет каких-либо указаний на необходимость применять прави 

ла Юникода. В число последних входят: 


• Внутренней кодировкой целевой строки или самого шаблона является ОТЕ-8; 
• присутствуют символы с кодами выше 255; 
• используются спецификаторы свойств вида \ріСВОЙСТВО} или \Р4СВОЙСТВО}; 


• используются именованные символы, псевдонимы или последовательности 
вида \ {МАМЕ}, или кодовые пункты вида \№{И+НЕХОГСТТ$}. 


В огсутствие каких-либо объявлений, принудительно устанавливающих семан- 
тику модификаторов /и, /а и /1, по умолчанию используется двойной (4иа]) ре- 
жим, /1. Шаблоны с модификатором /с могут проявлять или не проявлять пове- 
дение, свойственное режиму работы с Юникодом. Традиционно такое смептива- 
ние семантик АЗСИ и Юникода служило источником бесконечной путаницы, 
поэтому в области действия прагмы и5е \5 14 данный модификатор больше не дей- 
ствует по умолчанию. Однако вы можете явным образом включить режим Юни- 
кода. Поддержку строк Юникода можно включить любым из следуюших спо- 
собов: 


изе Ееатиге ип1соде_51г1п95 ; 
изе Геафиге “:5.14”; 

изе %5. 14, 

иѕе 5.14.0; 


Поддержку строк Юникода можно также включить с помощью ключей команд- 
ной строки Регі, соответствующих четырем прагмам, перечисленным выше: 


УХ рег1 -МГеафиге=ип1соде_$1г1п9$ дополнительные аргументы 
Х рег1 -МГеафиге=:5.14 дополнительные аргументы 

Хх рег1 -М5.014 дополнительные аргументы 

Х рег1 -М5. 14.0 дополнительные аргументы 
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Поскольку ключ командной строки -Е подразумевает использование набора осо- 
бенностей текущей версии Регі, он также включает поддержку строк Юникода 
(в у5.14+): 


Х рег1 -Е программный код для выполнения 


Как для большинства прагм, имеется возможность выключать отдельные особен- 
ности в отдельных областях видимости, так что прагма 


по Геафиге “ип1соде_5Ег1п9$”, 


отключит семантику Юникода в охватывающей лексической области видимости. 


Чтобы упростить управление поведением регулярных выражений, не прибегая 
каждый раз к использованию модификаторов, можно задействовать прагму ге 
для управления флагами по умолчанию в лексической области видимости. 


# определить модификаторы по умолчанию для всех шаблонов 
изе ге "/тзх”; # эти модификаторы будут автоматически добавляться ко всем 
# шаблонам в данной области видимости 


# отменить некоторые из модификаторов для вложенной Области видимости 


{ 
по ге “/шз”; # эти модификагоры будут автоматически убираться из шаблонов 
# в данной области видимости 


} 


Это особенно удобно, когда речь идет о модификаторах, относящихся к набору 
символов: 


иѕе ге "/и"; # Режим Юникода 

изе ге "/0"; # двойственный режим, АЗСТТ-Юникод 

иѕе ге ”/1"; # режим использования набора 8-бигных национальных символов 

и3е ге “/а”; # режим АЗС11, плюс механизм свертки регистра из Юникодё 

ие ге “/аа"; # жесткий режим АЗСТТ, без механизма свертки регистра из Юникода 


Благодаря этим объявлениям вам не придется вновь и вновь повторять одни и те 
же модификаторы, чтобы обеспечить последовательное применение нужной се- 
мантики, или даже последовательное применение неправильной семантики. 


Оператор т// (поиск) 
п/РАТТЕНМ/ модификаторы 
/РАТТЕНМ модификаторы 
?РАТТЕН№М модификаторы (устаревшая форма) 


ЕХРА =- т/РАТТЕВМ/модификаторы 
ЕХРА =- /РАТТЕВМ/модификаторы 
ЕХРА =- ?РАТТЕНМ? модификаторы (устаревшая форма) 


Оператор п// ищет в строке скаляра ЕХРА соответствие шаблону РАТТЕНА. Если огра- 
ничителем служит символ / или 7, то присутствие начальной п не обязательно. 
Символы ? и ` имеют специальное значение в качестве ограничителей: первый слу- 
жит для поиска единственного соответствия, а второй подавляет интерполяцию 
переменных и семь езсаре-последовательностей трансляции (\0 и прочих, они 
описаны далее). 
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Если результатом вычисления РАТТЕНМ оказывается пустая строка — например, по- 
тому, что вы указали пустой шаблон, или потому, что интерполируемая перемен- 
ная содержала пустую строку, то для поиска используется последнее успешно об- 
работанное регулярное выражение, не скрытое во внутреннем блоке (или в $р11\, 
дгер или пар). 


В скалярном контексте оператор возвращает в случае успешного выполнения 
значение «истина» (1), а в противном случае значение «ложь» (""). В логическом 
контексте обычно можно видеть такую форму: 


11 ($ѕһіге =- т/Ваддіпѕ/) { } # искать Ваддіпѕ в $5һіге 
1Ғ ($ѕһіге =- /Ваддіпѕ/) { . . } # искать Ваддіпѕ в $һіге 


1Е ( т#Вадбіпѕй ) { .. } # искать прямо в $_ 
іР ( /Ваддіпѕ/ ) { } # искать прямо в $_ 


В списочном контексте оператор п// возвращает список подстрок, соответствую- 
щих сохраняющим скобкам в шаблоне (т.е. $1, $2, $3 и т. д.), как описывается далее, 
в разделе «Захват и группировка». Нумерованным переменным присваиваются 
значения даже в списочном контексте. Если поиск в списочном контексте не дал 
результатов, возвращается пустой список. А если успешен, но сохраняющих ско- 
бок в шаблоне нет (как и модификатора /9), возвращается список со значением (1). 
Поскольку при безрезультатном поиске возвращается пустой список, этот формат 
п// можно применять в логическом контексте, но только в косвенном виде, через 
присваивание списку: 


1Е (($кеу, $уацие) = /(\м+): (.*)/) { .. } 


Допустимые для п// (в любом его обличье) модификаторы перечислены в табл. 5.2. 
Таблица 5.2. Модификаторы т// 


Модификатор | Значение 


д Игнорировать различия в регистре символов 

/т Позволить символам > и $ соответствовать позиции рядом с внедренным 
символом /п 

/8 Позволить символу соответствовать переводу строки 

/х Игнорировать (большинство) пробельных символов и разрешить коммен- 
тарии в шаблоне 

/о Компилировать шаблон только один раз 

/р Сохранять найденные соответствия 


/а Двойной режим работы с набором символов АЗСП-Юникод (прежний ре- 
жим по умолчанию) 

би Режим работы с набором символов Юникода (новый режим по умолчанию) 

/а Режим работы с набором символов АСП 

л Режим работы с набором символов, определяемым региональными на- 


стройками времени выполнения (режим по умолчанию при использова- 
нии прагмы изе Іоса1е) 


Глобальный поиск всех соответствий 


/9 


Разрешить продолжение поиска после неудачи поиска /0 
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Большинство из этих модификаторов относятся к регулярному выражению и бы- 
ли описаны выше. Последние два меняют режим работы самого оператора поис- 
ка. Модификатор /9 предписывает глобальный поиск, т.е. поиск всех соответст- 
вий шаблону, содержащихся в строке. Однако его действие зависит от контекста. 
В списочном контексте п//д возвращает список всех найденных соответствий. 
Найдем, например, все места, где упоминается "рег1", “Рег1", “РЕВ” и тому подоб- 
ные варианты: 


1? (@рег1$ = $рагадгарһ =- /рег1/91) { 
рг1пЕР “Рег1 упомянут %0 раз.\п“, ѕсаЈаг @рег1$; 
} 


Если в шаблоне с модификатором /д нет сохраняющих скобок, возвращаются 
полные соответствия. Если сохраняющие скобки есть, возвращаются только за- 
хваченные строки. Пусть имеется такая строка: 


$51гіпо = "раззиюгО=ху22у уегроѕе=9 зсоге=С“; 


Пусть также требуется использовать ее для инициализации хеша, как показано 
ниже: 


фһаѕһ = (раѕѕмога => “”ху72у”, уегроѕе => 9, зсоге => 0); 


Мешает, конечно, то обстоятельство, что исходно мы имеем строку вместо списка. 
Чтобы получить соответствующий список, можно примените оператор п//0 в спи- 
сочном контексте и захватить все пары ключ/значение, имеющиеся в строке: 


Жһаѕһ = $51гіпо =- /(\м+)=(\м+)/д; 


Последовательность (\м+) захватывает слово из алфавитно-цифровых символов. 
См. раздел «Захват и группировка» далее в этой главе. 


В скалярном контексте модификатор /д предписывает поступательный поиск, 
что заставляет Рей искать следующее соответствие для той же переменной, начи- 
ная с позиции, следующей сразу за последним найденным соответствием. Утвер- 
ждение \б представляет эту позицию в строке (см. описание \С далее в этой главе, 
в разделе «Позиции»). Если помимо /0 действует также модификатор /с («сопії- 
пие»), то, когда /9 заканчивает работу, последний безрезультатный поиск не сбра- 
сывает указатель позиции. 


Если в качестве ограничителя выступает 7, как в п?РАТТЕВ№? (или просто ?РАТТЕАЛ?, 
но форма без п является устаревшей), поиск выполняется, как обычный /РАТТЕВМ/, 
но при этом мы ищем только одно соответствие между вызовами оператора гезет. 
Такой прием может дать удобный способ оптимизации, если во время прогона 
программы требуется найти не все соответствия шаблону, а только первое. Опера- 
тор осуществляет поиск при каждом вызове, пока, наконец, что-нибудь не най- 
дет, после чего выключается и будет возвращать «ложь», пока не будет повторно 
включен с помощью явного вызова геѕеї. Работу по отслеживанию состояния по- 
иска Ре! берет на себя. 


Оператор п?? полезнее всего в ситуации, когда обычный поиск по шаблону нахо- 
дит последнее, а не первое соответствие: 


ореп(ВІСТ, "/иѕг/д1сї/могаѕ") ог діе "Невозможно открыть могаѕ: $!\п”; 
мһі1е (<0ІСТ>) { 
фҒігеі = $1 11 т? (^ пеиг .* )?х; 
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$1аѕ = $1 11 т ( пешг .* )/х, 
} 
зау $#ігѕї: # выведет “пеигад” 
зау $1азт; # выведет “пеигурпо10ду” 


Оператор гезе{ сбрасывает только экземпляры 77, скомпилированные в том же 
пакете, что и вызов геѕеї. Высказывание п?? эквивалентно высказыванию ??. 


Оператор 5/// (подстановка) 
Ѕ/РАТТЕВМ/ВЕРІ АСЕМЕМІ / модификаторы 


[УАШЕ =- з/РАТТЕВМ/ВЕРЕАСЕМЕМТ/ модификаторы 
ВУАШЕ =- $/РАТТЕВМ/ВЕРЕАСЕМЕМТ/к модификаторы 


Этот оператор ищет в строке соответствие шаблону РАТТЕНМ и, если оно найдено, 
заменяет найденную подстроку текстом РЕРЕАСЕМЕМТ. Если РАТТЕВМ — пустая строка, 
используется последнее успешно обработанное регулярное выражение. 


$10їг = $һорріт; # Просто копируем Хоббита 
$10їг =- 5/В1100/Егойо/9; # и легко пишем продолжение. 


При наличии модификатора /т оператор $/// возвращает строку результата, а це- 
левая строка слева остается неизмененной. Без модификатора /г оператором 5/// 
возвращается значение (одинаковое в скалярном и списковом контекстах), рав- 
ное количеству выполненных подстановок (оно может быть больше одного при 
использовании модификатора /0, описанного выше). В случае неудачи, поскольку 
количество замен равно нулю, возвращается значение «ложь» (""), численный эк- 
вивалент 0.1 


іҒ ($10+г =- 5/В1100/Егодо/) { зау “Продолжение успешно написанс ” } 
$спапде_соипе = $10%г =- 5/В1100/Егойо/9; 


Обычно любое соответствие шаблону РАТТЕНМ теряется при замене, однако имеется 
возможность «сохранить» соответствия, включив в шаблон метасимвол \ к: 


фїа1еѕ оғ ВАоһап =- ѕ/Ёо\Кпег/жуп/9 #8 переписать историю 


Часть оператора, определяющая заменяющий текст (ПЕРІАСЕМЕМТ), рассматривает- 
ся как строка в двойных кавычках. В строке замены можно использовать любые 
из описанных выше переменных с динамической областью видимости ($, $8, $, $1, 
$2 и другие), относящихся к шаблонам, а также любые другие связанные с двой- 
ными кавычками приемы, которые вам вздумается применить. Вот, например, 
как найти все строки "ге\1$1оп", “мегѕіоп", "ге]еазе” и заменить каждую из них эк- 
вивалентом из заглавных букв с помощью управляющего символа \и в части под- 
становки: 


з/геміѕіог |мегѕіоп | ге1еаѕе/\и$8/0; # Используйте | для обозначения 
# “или” в шаблоне 


Как и при использовании оператора п//, и многих других более привычных операторов, 
описанных в главе 3, это — особое «ложное» значение, которое безопасно использовать 
в качестве числа. Это обусловлено тем, что, в отличие от обычной пустой строки, данное 
значение не приводит к предупреждениям о неявном преобразовании строки в число. 
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В контексте двойных кавычек разыменовываются все скалярные переменные, 
а не только эти необычные. Допустим, у нас есть хеш %Маптез, где хранятся соот- 
ветствия номеров версий внутренним названиям проектов: например, $№апеѕ{"3.0"} 
содержит кодовое имя `Іѕепдагі”. Можно посредством $/// найти номера версий 
и заменить их соответствующими названиями проектов: 


ѕ/мегѕіоп ([0-9. ]+) /%һе $№атез{$1} ге1еазе/д: 


В строке подстановки $1 возвращает то, что сохранила первая (и единственная) 
пара скобок. (Можно также использовать формат \1, как в шаблоне, но в строке 
подстановки такой стиль не приветствуется. В обычной строке, заключенной 
в двойные кавычки, \1 означает Сопіго!-А.) 


Интерполяция переменных происходит в обеих строках, РАТТЕВМ и РЕРЕАСЕМЕМТ, но 
РАТТЕВМ интерполируется всякий раз, когда оператор $/// выполняется в целом, 
а ПЕРЕАСЕМЕМТ интерполируется каждый раз, когда найдено соответствие шаблону. 
(РАТТЕВМ может находить несколько соответствий при каждом прогоне, если ука- 
зан модификатор /9.) 


Как и ранее, большинство модификаторов в табл. 5.3 изменяет действие регуляр- 
ного выражения; они те же, что вп// и дг//. Последние три модификатора изменя- 
ют сам оператор подстановки. 


Таблица 5.3. Модификаторы 8/// 


Модификатор | Значение 


/і Игнорировать различия в регистре символов 

/т Позволить символам ^ и $ соответствовать позиции рядом с внедренным 
символом /п 

/= Позволить символу . соответствовать переводу строки 

/х Игнорировать (большинство) пробельных символов и разрешить коммен- 
тарии в шаблоне 

/о Компилировать шаблон только один раз 


Сохранять найденные соответствия 


Двойной режим работы с набором символов АЗСП-Юникод (прежний ре- 
жим по умолчанию) 


/о Режим работы с набором символов Юникода (новый режим по умолчанию) 
/а Режим работы с набором символов АЗСИ 
ГАІ Режим работы с набором символов, определяемым региональными на- 


стройками времени выполнения (режим по умолчанию при использова- 
нии прагмы ие 10са1е) 


Глобальный поиск всех соответствий 


/9 
/г 


Вернуть результат подстановки, не изменять исходную строку 


Вычислять правую часть как выражение 


Модификатор /д используется с оператором 5/// для замены всех соответствий 
РАТТЕНМ значением ПЕРІАСЕМЕЛТ, а не только первого найденного. Оператор 5///9 дей- 
ствует как глобальный поиск с заменой, внося все изменения одновременно, даже 
в скалярном контексте (в отличие от п//9, выполняющего поступательный поиск). 
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Модификатор /г (неразрушающее воздействие) выполняет подстановку в новой 
копии исходной строки, которая уже не должна быть переменной, и возвращает 
копию, независимо от того, была ли выполнена подстановка — исходная строка не 
изменяется ни при каких обстоятельствах: 


зау "Рёадо1 `5 г1пд!” =- 5/0/5т/г; # выведет “5теад01`$ г1пд! ` 


Копия всегда будет простой строкой, даже если на вход оператора подать объект 
или связанную переменную. Этот модификатор появился в Рег! версии у5.14. 


Модификатор /е рассматривает РЕРЕАСЕМЕМТ как фрагмент кода Рег], а не как ин- 
терполируемую строку. Результат выполнения этого кода выступает в качестве 
строки подстановки. Например, 5/([0-9]+)/ѕргіпі?("%#х”, $1)/де преобразует все 
числа в шестнадцатеричные, заменяя, например, 2581 на 0х023. Или предполо- 
жим, внашем прежнем примере мы не уверены в наличии названий для всех вер- 
сий, поэтому все остальные хотим оставить без изменений. Творчески применив 
форматирование /х, можно сказать: 
$4 

мегѕ1оп 

\ѕ+ 

( 


) 


[0-9. ]+ 


н 
$Матез{$1} 
? {пе $№атез{$1} ге1еаѕе” 
: $8 
хде; 


Правая часть 5///е (или, в данном варианте, нижняя часть) проходит синтаксиче- 
скую проверку и компилируется на этапе компиляции программы в целом. Син- 
таксические ошибки обнаруживаются во время компиляции, а исключительные 
ситуации времени выполнения не перехватываются. Каждый дополнительный 
модификатор /е после первого (например. се, еее и так далее) эквивалентен вы- 
зову ема] 57ВІМ над результатом выполнения кода, по одному вызову на каждый 
дополнительный модификатор /е. При этом вычисляется результат выражения, 
представленного кодом, а информация об исключительных ситуациях сохраня- 
ется в специальной переменной $6. Дополнительные сведения можно найти в раз- 
деле «Программные шаблоны» далее в этой главе. 


Модификация строк еп раѕѕапќ' 


Иногда требуется, чтобы новая, модифицированная строка не портила старую, на 
которой она основана. Вместо того чтобы писать: 


$10їг = $һоррії, 
$10Ёг =- 5/Ві16о/Егоао/9; 


можно объединить эти команды в одну. Порядок старшинства операторов требу- 
ет, чтобы присваивание было заключенс в круглые скобки, как в большинстве 
случаев нетривиального применения =- к выражению. 


($1отг = $һорбії) =- 5/В1100/Егодо/9; 


1 На проходе (фр.) – Прим. перев. 
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В отсутствие скобок была бы изменена строка $һћорбії, а в $10їг мы получили бы 
количество произведенных замен, так что продолжение книги «Хоббит» вышло 
бы довольно скучное. 


И, да, в настоящее время можно с тем же успехом использовать модификатор /': 
$10їг = $һоббії =- з/Ва16о/Ргодо/ц! 


Но многие поклонники Рег! по-прежнему используют старую идиому. 


Модификация массивов еп таѕѕе! 


Применить оператор $/// непосредственно к массиву нельзя. Для этого нужен 
цикл. По счастливому совпадению, свойство циклом Гог/огеасН создавать псевдо- 
нимы в сочетании с использованием $_ в качестве переменной цикла по умолча: 
нию лежит в основе стандартной идиомы Ре! для поиска и замены в каждом эле- 
менте массива: 


Гог (@спарфегз) { 5/В1160/Егодо/о } я Сделать замену в каждой главе 
$/В1160/Егодо/д Гог @спартегз; # То же самое. 


Каки для простых скалярных переменных, можно сочетать подстановку с при- 
сваиванием, если требуется сохранить исходные значения: 


@о1апиез = ('"Б1иер1га', `Б1иедгаз$ , ‘Б1иеР1зп`, ‘Не б1иеѕ'); 
Тог (@пемћиеѕ = @о10һџеѕ) { $/61ие/гед/ } 
ргіпЕ “@пемпиез\п”* # выведет гедбігд геддгазз гейғіѕһ їһе гей5 


Другой способ проделать то же самое: объединить модификатор /г (ок появился 
в у5.14) с оператором пар: 


@пемпиез = тар { $/61ие/гед/г } @о1аниез; 


Идиоматический способ выполнения нескольких подстановок для одной пере- 
менной является применение цикла из одной итерации. Вот пример приведения 
в каноническую форму пробельных символов в строке: 


Рог ($5тг1п9) { 


5/7\5+//; # отбросить пробельные символы в начале строки 
3/\$+$//; # отбросить замыкающие пробельные символы 
$/\$+/ /9; # сжать внедренные пробельные последовательности 


} 
что, по стечению обстоятельств, дает такой же результат, как и 
$31119 = ]011(” , эре “, $5їгіпд); 


Или можно организовать такой же цикл с присваиванием, какой мы применили 
для массива: 


Тог (Фпемзпом = фо1аѕһом) { 
3/Егед/Нотег/д, 
ѕ/мі1та/Магде/о; 
5/Рерр1еѕ/1ііѕа/а, 
3/01по/ВагЕ/д; 


1 Массовая (фр.) — Прим. перев. 
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Когда глобальная подстановка оказывается 
недостаточно глобальной 


Иногда модификатора /д оказывается недостаточно, чтобы произвести все необхо- 
димые изменения: то исходная строка содержит перекрывающиеся соответствия, 
то подстановку хочется производить справа налево, то нужно, чтобы длина $` из- 
менялась от одного соответствия к другому. Как правило, повторные вызовы $/// 
позволяют добиться нужного результата. Однако хорошо бы, чтобы цикл прекра- 
тился, когда 5/// не найдет решительно ничего, поэтому подобную конструкцию 
мы заключаем в условный оператор, а в теле цикла, выходит, делать уже нечего. 
Поэтому мы просто пишем в теле цикла 1, что довольно скучно, но иногда скука — 
это лучшее, на что можно рассчитывать. Вот несколько примеров использования 
этих странных зверюшек из регулярных выражений, продолжающих возникать 
тути там: 


# расставить в нужных местах целого числа запятые 


мһіле /(\9) (\а\о\а) (2! \9)/$1, $2/; 


# заменить табуляцию на пробелы по 8 в колонке 
мпі1е 9/\1+/" “х (1епдїћ($8)*8 - Іепоїћ($` )%8) /е; 


рач 


— 


# удалить (вложенные {даже глубоко вложенные (как это))) замечания 


иле з/\([7()3*\)//9: 


# удалить слова, повторяющиеся дважды (у трижды (и четырежды... )) 


мһіле з/\Ь(\м+) \1\6/$ 1/91; 


В последнем случае требуется цикл, иначе 


- 


рач 


Рагіѕ іп ТНЕ ТНЕ ТНЕ ТНЕ вргіпо. 
превратится в 
Рагіѕ іп ТНЕ ТНЕ ургіпо. 


что может вызвать перед глазами того, кто немного знает французский, образ Па- 
риса, сидящего в артезианском колодце с ледяным чаем, ведь «іһе» по-француз- 
ски - «чай»! Парижанина, конечно, не обманешь. 


Оператор транслитерации #/// 
Тг/ЅЕАВСНЕ ТЗ | /ВЕРЕАСЕМЕКТЕТ$Т/са$г 


ІУАШЕ =- г/ЗЕАВСНЕТЗТ/ВЕРЕАСЕМЕМТЕТ$Т/с9$ 
АМАЦЈЕ == г/ЗЕАВСНЕТЭТ/ВЕРЕАСЕМЕМТЕТ$Т/С9$г 
ВУАШЕ =- Ег/ЅЕААСНІІ5Т//с 


Поклонникам зе посвящается оператор у///, в качестве синонима *г/””, По этой 
причине нельзя вызывать функции с именем у, как и функции с именами дили п. 
Во всех остальных отношениях у/// совпадает с 1г///, и больше мы об этом гово- 
рить не будем. 

Может показаться, что этот оператор не вписывается в главу о поиске по шаблону, 


поскольку в нем не используются шаблоны. Он просматривает строку символ за 
символом и заменяет каждый символ, оказывающийся в 5ЕАВСНЕ ІТ (это не регу- 


' Вргіпе – весна; родник; Рагіѕ – Париж; Парис, сын Приама. – Прим. перев. 
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лярное выражение), на соответствующий символ из ПЕРІ АСЕМЕМТІ 157 (это не строка 
подстановки). Однако этот оператор несколько похож на п// и 5///, и сним даже 
можно применять операторы привязки =- или !-, почему мы и описываем его 
здесь. (Операторы дг// и $р111 выполняют сопоставление с шаблоном, но с ними не 
используются операторы привязки, поэтому они находятся в другом месте кни- 
ги. Вот так все непросто.) 


Транслитерация возвращает число замененных или удаленных символов. Если 
строка не задана явным образом, с помощью операторов =- или !-, изменения вно- 
сятся в строку $_. В ЗЕАВСНЕТУТ и ВЕРЁЕАСЕМЕМТЕТ5Т можно определять диапазоны по- 
следовательных символов с помощью дефиса: 


$теззаде =- +г/А-Га-7/№-ГА-Мп-ха-м/; # шифрование гої13. 


Обратите внимание, что диапазон вроде А-2 предполагает линейный набор симво- 
лов типа АЗСП. Но в каждом наборе символов есть свои представления о том, как 
они упорядочены, и, следовательно, о том, какие символы попадают в конкрет- 
ный диапазон. Разумный принцип состоит в использовании только таких диапа- 
зонов, начало и конец которых находятся в том же алфавите либо в одном регист- 
ре (а-е, А-Е), или являются цифрами (0—4). Ко всем остальным следует относить- 
ся с подозрением. Если есть сомнения, укажите набор символов явным образом: 
АВСОЕ. Даже применение простых диапазонов, таких как [^-Е], может закончиться 
провалом, тогда как применение полных наборов символов вида [АвсоЕ] будет да- 
вать положительные результаты, потому что коды малых заглавных латинских 
букв не следуют по порядку, как показано в табл. 5.4 


Таблица 5.4. Коды малых заглавных латинских букв 


Категория | Алфавит 
вс=и | $С=Гаыт 


Название 


Т.АТІМ ГЕТТЕВ 5МАГТ, САРІТАІ, А 


А 0+1р00 

В 0+0299 5С=Гайп ГАТІМ ГЕТТЕВ ЗМАГЛ, САРІТАІ В 
С 0+1004 8С=Гайп Т.АТИМ ГЕТТЕВ ЗМА!Т, САРГТАГ, С 
р 0+1005 @с=ы | 8С=Гайп ГАТИМ ГЕТТЕВ ЗМАГТ, САРГТАТ, 2 
Е 01007 @с=ы | 8С=Гайп Г.АТИМ ГЕТТЕК ЗМАМ, САРІТАІ Е 


В ЅЕААСНІТ5Т и РЕРЕАСЕМЕМТЕТСТ интерполяция переменных не производится, как 
в строках в двойных кавычках; можно, однако, использовать последовательно- 
сти с обратной косой чертой, соответствующие конкретным символам, например 
\п или \015. 


В табл. 5.5 перечислены модификаторы, применимые к оператору ! г/^* Они совер- 
шенно отличны от тех, которые применяются к! /, или дг//, даже если выгля- 
дят так же. 


Таблица 5.5. Модификаторы ї7/// 


Модификатор | Значение 


/с Дополнение ЅРААСН/ І5Т 
/9 Удалить найденные, но не замененные символы 
/ѕ Сжать повторяющиеся замененные символы 


Вернуть результат транслитерации, не изменять исходную строку 
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Если задан модификатор /г, транслитерации подвергается новая копия строки, 
которая и возвращается. Она может не быть 1-значением. 


ѕау “Огодо” =- Ёг/ро/Еа/г: # Огодо -> Егодо 


Если задан модификатор /с, осуществляется дополнение набора символов в 5ЕАНСН- 
[15Т: т.е. фактический список для поиска состоит из всех символов, отсутствую- 
щих в ЗЕАНСНЕ ТЕТ. В случае применения Юникода таких символов может оказать- 
ся очень много, но, поскольку они хранятся логически, а не физически, можно не 
беспокоиться о том, что не хватит памяти. 


Модификатор /0 превращает 1г/// в оператор «замены-удаления»: любые симво- 
лы, указанные в 5ЕАВСНИТ$Т, для которых не задана замена в ЛЕРІ АСЕМЕМТІ 157, уда- 
ляются. (Это дает несколько большую гибкость, чем ключ -0 в некоторых про- 
граммах #"(1), удаляющих только то. что они находят в ЅРАНСНІ 157.) 


Если задан модификатор /5, то последовательности символа, превращаемого 
в тот же символ, сжимаются до единственного символа. 


При использовании модификатора /9 список РЕРГАСЕМЕМТ1 157 всегда интерпретиру- 
етсяточнотак, как он задан. Вотсутствие этого модификатора, если ПЕРГАСЕМЕМТІ ІТ 
короче ЅРАПСНІ І5Т, последний символ БЕРІ АСЕМЕМТІ І5Т размножается до достижения 
нужной длины. Если ПЕРГАСЕМЕМТІ ІТ представляет собой пустую строку, в него ко- 
пируется ЅРАНСНІІ5Т, что полезно, если требуется просто подсчитать символы, нє 
заменяя их. Это полезно также для сжатия символов посредством /5. Если требу- 
ется всего лишь подсчитать количество символов, можно просто использовать 
ВУАШЕ вместо (МАШЕ. 


1г/ае1ои/!/; # заменить все гласные на! 
г\л. }{_}; # заменить необычные символы на подчеркивание 


$соийЕ = (Фрага =- 1г/\п//); # подсчитать количество переводов строки в $рага 
ФсоипЕ = 1г/0-9//; # подсчитать цифры в $_ 


1г/@$%»//о; В удалить указанные 


# изменить еп раѕѕапі 
($НОЅТ = Фһћоѕ) =- Ег/а-2/А-2/: 


# результат тот же, но как г-значение 
фНОЅТ = ($һоѕї =- Тг/а-2/А-2/г); 


фраєһпате =- 1г/а-2А-2/_/сз; # заменить небуквы (АЗСТТ) на подчеркивание 


Если в 5ЕАВСНЕ І5Т один и тот же символ повторяется несколько раз, то использует- 
ся только первый, поэтому команда 


ТГ/ААА/ХҮ2/ 


поменяет все символы А на Х (в $ ). 


Хотя переменные не интерполируются в ї11///, того же эффекта можно добиться 
с помощью е\уа1 ЕХРА: 


Фсоцпт = ема1 “1г/$01911$1/$пем11$1/”; 
91е 1 $6, # распространяет исключение при недопустимом содержимом еуа1 
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Еще одно замечание: не используйте 1г/// для перевода текста в верхний или ниж- 
ний регистр. В этом случае следует предпочесть последовательности \Џ или \\. 
в строках, заключенных в двойные кавычки (или эквивалентные функции ис 
и 1с), поскольку они учитывают национальные установки и Юникод, а 1г/а-2/А-7/ 
не учитывает. Кроме того, в строках Юникода последовательность \и и соответст- 
вующая ей функция исѓігѕї учитывают понятие «заглавного регистра» (#1 есазе), 
который для некоторых символов отличается от верхнего регистра. 


Последовательность \Ғ соответствует функции Гс; см. описание їс в главе 27. Они 
появились в Ре! у5.16 и служат для сравнения без учета регистра символов, на- 
пример: “\Е$а” ед “\Е$Ь”, или эквивалентное выражение, 1с($а) ед #с($0). Чтобы 
обеспечить сопоставление без учета регистра, всегда применялся модификатор /1, 
внутренне использующий механизм свертки; теперь появились последователь- 
ность \Ғ и функция ѓс, обеспечивающие более прямолинейный доступ к этому ме- 
ханизму. См. также раздел «Сравнение и сортировка текста Юникода» в главе 6. 


Метасимволы и метазнаки 


Теперь, полюбовавшись на все замысловатые клетки, можем продолжить разгля- 
дывать тварей, которые в этих клетках находятся – на те забавные значки, кото- 
рые помещают внутрь шаблонов. Думается, сейчас вы уже свыклись с тем обстоя: 
тельством, что эти значки не являются обычным программным кодом на Рег], 
таким как вызовы функций или арифметические операторы. Регулярные выра- 
жения представляют собой маленький самостоятельный язык, укрытый в не- 
драх Рен. (В каждом из нас есть немного джунглей.) 


При всей своей мощи и выразительности шаблоны в Регі распознают те же 12 обыч- 
ных метасимволов, которые имеются во многих других пакетах, поддерживаю- 
щих регулярные выражения: 


о вжо 


Некоторые из них меняют правила, делая особенными следующие за ними симво- 
лы, которые при других обстоятельствах ничем особенным не отличаются. Мы не 
хотим называть длинные последовательности символами, поэтому, когда такие 
последовательности образуются, мы называем их метазнаками (теазут6о5, 
или иногда просто $716015). Но на верхнем уровне эти двенадцать метасимволов 
представляют собой все, о чем вы (и Рег!) должны думать. Все остальное происте- 
кает из них. 


Некоторые простые метасимволы (., ^, $) действуют самостоятельно. Они не ока- 
зывают непосредственного влияния на соседние символы. Другие метасимволы, 
например \, действуют как префиксные операторы, управляя тем, что следует за 
ними. Третьи, например, +, + и ?, действуют как постфиксные операторы, управ- 
ляя тем, что непосредственно предшествует им. Один метасимвол, |, действует 
как инфиксный оператор, располагаясь между подвластными ему операндами. 
Есть даже структурирующие метасимволы, действующие как охватывающие 
операторы и управляющие тем, что в них содержится; например, к ним относят- 
ся (...) и [...1. Особенно важны круглые скобки, поскольку они ограничивают | 
изнутри, а *, +и ? снаружи. 
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Если запоминать только один из этих двенадцати метасимволов, следует запом- 
нить обратную косую черту. (Ну... еще круглые скобки.) Это связано с тем, что об- 
ратная косая черта отключает все остальные. Когда она предшествует в шаблоне 
символу, не являющемуся буквой или цифрой, то превращает этот символ в лите- 
рал. Если необходимо найти по шаблону один из этих двенадцати метасимволов 
буквально, его нужно предварить обратной косой чертой. Поэтому \. соответству- 
ет действительной точке, \$ — действительному знаку доллара, \\ – действитель- 
ной обратной косой черте и т.д. Это называют «экранированием» метасимвола 
(«евсарте», «диобіпе» или «аск%1аѕһіпо»). (Конечно, вы уже знаете, что обрат- 
ная косая черта используется для подавления интерполяции переменных в стро- 
ках, заключенных в двойные кавычки.) 


Обратная косая черта превращает метасимвол в литеральный, но действие его на 
последующий буквенно-цифровой символ — иное. Что было без обратной косой 
черты обычным, превращается в особенное. Это значит, что вместе они образуют 
метазнак. Алфавитный список этих метазнаков можно найти ниже, в табл. 5.9. 


Таблицы метазнаков 


В последующих таблицах в колонке «Атомарный» указывается «да», если мета- 
знак поддается количественному определению (может соответствовать чему-то, 
обладающему в какой-то мере шириной), Мы также применяли многоточие (...) 
для представления «чего-то еще». (Пожалуйста, прочтите приводимое далее опи- 
сание, чтобы понять, что означает , если это было непонятно из однострочного 
пояснения в таблице.) 


В табл. 5.6 приведены основные обычные метазнаки. Первые четыре из них явля- 
ются структурирующими, и о них говорилось выше, тогда как последние три — 
это просто метасимволы. Нримером атома служит метасимвол . (точка), посколь- 
ку он соответствует чему-то, имеющему ширину (в данном случае ширину симво- 
ла); ^ и $ представляют собой примеры утверждений, поскольку соответствуют 
чему-то, имеющему нулевую ширину, и вычисляются, только чтобы выяснить, 
истинны они или нет. 


Таблица 5.6. Общие метасимволы регулярных выражений 


Символ | Атомарный | Значение 


По-разному | Сделать обычным следующий не буквенно-цифровой метасимвол 
и (возможно) сделать метасимволом следующий буквенно-цифро- 
вой символ 


Перечисление (соответствие одному или другому) 
Группа (рассматривается как единое целое) 
Класс символов (соответствие одному символу из набора) 


Истинно в начале строки (или, возможно, после любого символа 
перевода строки) 

Соответствие одному символу (обычно, кроме символа перевода 
строки) 

Истинно в конце строки (или, возможно, перед любым символом 
перевода строки) 
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Квантификаторы, которым ниже посвящен отдельный раздел, показывают, сколь- 
ко раз предшествующий атом (т.е. отдельный символ или группа символов) дол- 
жен быть найден. Они перечислены в табл. 5.7. 


Таблица 5.7. Квантификаторы регулярных выражений 


Максимальный | Минимальный | Неуступающий | Допустимый диапазон 


{МТМ МАХ} {МТМ. МАХ}? {МТМ. МАХ }?+ Не меньше МА соответствий, но не 
больше МАХ 

{МІМ, } {МІМ, }? {МІМ, }?+ Не меньше МТ/ соответствий 

{СОимт} {Соимт}? {СОиМТ}?+ Ровно СОШМТ соответствий 


* *+ 0 или более соответствий (то же, 


что и {0,}) 


І или более соответствий (то же, 
| чтои {1, Н 


0 или ] соответствий (то же, что 
и {0,1} 


Минимальный квантификатор пытается найти как можно меньше символов в от- 
пущенных ему пределах, максимальный – как можно больше. 


Например, .+ обеспечивает соответствие по крайней мере одному символу в стро- 
ке, но будет соответствовать всем им, если дать возможность. Эти возможности 
описываются далее в разделе «Маленький Механизм. который /(не)? может/» дан- 
ной главы. 


Неуступающий квантификатор действует как максимальный, за исключением 
того, что не уступает захваченные символы механизму возвратов, тогда как ми- 
нимальный и максимальный квантификаторы могут уступать. 


Заметьте, что квантификаторы нельзя квантифицировать. Обозначения, подоб- 
ные ?? и ++, являются самостоятельными квантификаторами, минимальным 
и неусгупающим, соответственно, а не односимвольным квантификатором, кван- 
тифицированным другим квантификатором. Квантификаторы могут определять 
только количество атомов, но сами квантификаторами атомами не являются. 


Мы стремились обеспечить расширяемый синтаксис для новых типов метазна- 
ков. Учитывая, что в нашем распоряжении была всего лишь дюжина метасимво- 
лов, мы выбрали для конструирования произвольных синтаксических расшире- 
ний прежде недопустимую для регулярных выражений последовательность. Все 
эти метазнаки, за исключением последнего, имеют вид (?КЕҮ...); т.е. (сбалансиро- 
ванная, имеющая пару) скобка, за которой следует вопросительный знак, за ко- 
торым следует КЕУ и оставшаяся часть подшаблона. Символ КЕҮ указывает на кон- 
кретное расширение синтаксиса регулярных выражений. Полный их список при- 
веден в табл. 5.8. В основном здесь структурирующие символы, поскольку они 
построены на скобках, но у них есть и дополнительные значения. И снова, кван- 
тифицироваться могут толькс атомы, поскольку они представляют нечто дейст- 
вительно существующее (потенциально). 
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Таблица 5.8. Расширенные последовательности регулярных выражений 


Расширение Атомарный | Значение ЧЕРИ 
(78 ) Комментарий, отбрасывается 

(2:2) Несохраняющая группа 

(?>...) Группировка, не сохраняющая и не уступающая симво- 


лы из найденногс соответствия 
(?ад1ирітѕх-ітѕх) Включить/отключите модификаторы шаблона 
(2^а1ирт$х) Сбрасывает и включает модификаторы шаблона 


Несохраняющая группа, плюс включение/выключение 
модификаторов шаблона 


(?ад1ирітѕх-1тѕх:...) 


Несохраняющая группа. плюс сброс и включение моди- 
фикаторов шаблона 


(?"а1ирітѕх:...) 


Истина, в случае успеха опережающей проверки 
Истина, в случае неудачи опережающей проверки 
Истина, в случае успеха ретроспективной проверки 
Исгина, в случае неудачи ретроспективной проверки 
(20|. 021.9 
(2?<МАМЕ>...) 


Выбор ветви для нумерованных групп 


Именованная сохраняющая группировка; также можно 
использовать форму записи (?'ЛАМЕ`. ). См. \К<МАМЕ> ниже 


(?{...)) 
(27...) 


Выполнить внедренный программный код на языке Рег] 


Поиск соответствия регулярному выражению из вне- 
дренного кода на Регі 


(?МОМВЕЋ) Вызывает независимое подвыражение в группе М№МВЕЯ; 
также можно использовать форму записи (?+МИМВЕВР), 
({?-МИМВЕВ), (?0) и (28). Использовать амперсанд здесь 


нельзя 


(2?&МАМЕ) Рекурсия в группе МАМЕ; здесь должен использоваться 


амперсанд; также можно использовать форму записи 
{?Р>МАМЕ) 

(?(СОМО)...|...) Поиск по шаблону 11-Феп-е5е 
(2(СО№)...) 


(?(РЕЕТМЕ)...) 


Поиск по шаблону 1{-{Веп 


Определение именованной групиы для последующего 
обращения как к «подпрограмме» (?&ЛАМЕ) 


(*УЕЯВ) Глагол управления механизмом возвратов; также мож- 


но использовать форму записи (*ИЕВВ: МАМЕ) 


Команды управления механизмом возвратов все еще находятся на стадии экспе- 
риментальных и потому не будут обсуждаться здесь. Тем не менее, вы можете 
столкнуться с ними рано или поздно, сунув свой нос в дела волшебников. Поэто- 
му обязательно ознакомьтесь со страницей рейге справочного руководства, если 
встретите любую из следующих команд: 

( *АССЕРТ) 


(+ СОММІТ) 
(+ҒАІ) (*Е) 
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(*МАВК: МАМЕ) (+: МАМЕ) 
(+РАУМЕ) (=РАЦМЕ: МАМЕ) 
(«КТР) (*ЭКТР:МАМЕ) 
(*ТНЕМУ (+ ТНЕМ: МАМЕ) 


Или просто бегите прочь. 


И наконец, в табл. 5.9 перечислены все ваши любимые буквенно-цифровые ме- 
тазнаки. (Знаки, обрабатываемые на этапе интерполяции переменных, помече- 
ны в колонке «атомарный» символом тире «—», поскольку Механизм их даже не 
увидит.) 


Таблица 5.9. Буквенно-цифровые метазпнаки регулярных выражений 


Символ | Атомарный | Значение 


\0 Соответствует с нулевому символу (0+0000, мотл,, мот.) 

\МММ Соответствует символу, заданному в восьмеричной системе, до \377 

\л Соответствует л-й сохраняющей группе (десятичное) 

\а Соответствует символу тревоги (АГЕВТ, ВЕІ) 

\А Истина, если в начале строки 

\0 Соответствует символу забоя (ВАСК$РАСЕ. В5) (только в символьных 
классах) 

\6 Истина, если граница слова 

\В Истина, если не граница слова 

\сх Соответствует управляющему символу Сопіго! Х (\с2, \с[ ит. д.) 

\С Соответствует одному байту (С сһаг) даже в ОТЕ-8 (опасно!) 

\а Соответствует любой цифре 

\В Соответствует любому нецифровому символу 

\е Соответствует символу ЕЅСАРЕ, ЕЗС. 

\Е Конец трансляции регистра (\Е, \, \0} или метакавычки (\() 

\# Соответствует символу новой страницы (ЕОКМ ҒЕЕР, ЕЕ) 

\Ғ Приведение к единому регистру всех символов до метасимвола \Е* 

\9{6800Р} Соответствует именованной или нумерованной сохраняющей 
группе 

\ Истинно в точке окончания предыдущего соответствия при поис- 
ке т//09 

\№ Соответствует любому горизонтальному пробельному символу 

\Н Соответствует любому символу, кроме горизонтального пробель- 
ного символа 

\Кк{СВОИР} Соответствует именованной сохраняющей группе, также можно 
использовать форму записи \К'МАМЕ` 

\К Исключить из совпадения текст слева от \К 

\1 Перевести следующий символ в нижний регистр (не свертка) 


= Метасимвол \Ғ и соответствующая ему функция їс появились в Рег у5.16. 


214 Глава 5 Поиск по шаблону 


Таблица 5.9 (продолжение) 


Символ | Атомарный | Значение 


№. Перевести в нижний регистр (не свертка) текст до \Е 

\п Соответствует символу новой строки (обычно ГЕ, МЕ ЕЕЕО) 

\№ Соответствует любому символу, кроме символа новой строки 

\М{МАМЕ} Соответствует именованному символу, псевдониму или последова- 
тельности, например: \№огеек:Ѕідпа} для «ХУ» 

Хо{ММММ} Соответствует символу с указанным восьмеричным кодом 

\р{РАОР} Соответствует любому символу с указанным свойством 

\Р{РАОР} Соответствует любому символу, не имеющему указанного свойства 

\0 Добавить обратную косую черту перед всеми последующими сим- 
волами, не являющимися буквами или цифрами, вплоть до \Е 

\г Соответствует символу возврата каретки (обычно САВВГ!АСЕ ВЕТОВМ, 
св) 

\В Соответствует любой графеме, обозначающей разрыв строки (толь- 
ко не в символьных классах) 

\5 Соответствует любому пробельному символу 

\5 Соответствует любому непробельному символу 

М Соответствует символу табуляции (СНАКАСТЕЕ ТАВОТ.АТЮМ, НТ) 

\и Перевести следующий символ в заглавный (не верхний) регистр 

\у Перевести в верхний (не заглавный) регистр текст до \Е 

\у Соответствует любому вертикальному пробельному символу 

\у Соответствует любому символу, не являющемуся вертикальным 
пробельным символом 

\м Соответствует любым «символам слова» (буквенно-цифровым, 
комбинационным знакам и соединителям) 

\И Соответствует любому символу, не являющемуся «символом слова» 

\х{арса} Соответствует символу с указанным шестнадцатеричным кодом 

\х Соответствует графеме (только не в символьных классах) 

\2 Истина, если конец строки 

\2 Истина, если конец строки или перед символом перевода строки 


Если в \р или \Р имя свойства состоит из одного символа, фигурные скобки не обя- 
зательны. Если в \х шестнадцатеричное число состоит из двух и менее цифр, фи- 
гурные скобки не обязательны. Отсутствие фигурных скобок в \\ означает соот- 
ветствие любому символу, кроме символа перевода строки. В \9 можно не исполь- 
зовать скобки, если вы ссылаетесь на нумерованную группу (однако мы рекомен- 
дуем использовать их всегда). 


Метасимвол \Ё соответствует либо символу САВВТАСЕ ВЕТОВМ, за которым следует 
символ ИМЕ ЕЕЕР (без уступки механизму возвратов), либо любому другому верти- 
кальному пробельному символу. Эквивалентен выражению (?>\г\п|\\). Отсутст- 
вие уступки механизму возвратов означает, что "\г\п” =- /\А\п/ может завершить- 
ся безрезультатно; обнаружив один раз пару символов СВЕЕ, Механизм позднее не 
изменит свое поведение для поиска самостоятельного символа САКВТАСЕ ВЕТОБМ, 
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даже если далее в шаблоне будет находиться фрагмент, требующий присутствия 
символа ИМЕ ЕБЕР для соответствия всего шаблона. 


В классах символов (квадратных скобках) могут использоваться только метасим- 
волы, в описании которых присутствует «Соответствует символу...» или «Соот- 
ветствует любому ...», и только если они соответствуют одному символу, поэтому 
метасимволы \В и \Х нельзя использовать в символьных классах. Это значит, что 
класс символов может соответствовать только одному символу в каждый момент 
и содержать только метазнаки, описывающие конкретные отдельные символы, 
Конечно, эти метасимволы можно использовать вне классов символов наряду 
с остальными неклассифицирующими метазнаками. Обратите внимание, что 
\6 – это два совершенно разных «зверя»: внутри класса символов это символ забоя 
(ЪасКзрасе), а вне его — утверждение границы слова. 


Метасимвол \К (от: «Кеер» — сохранить то, что уже совпало) не соответствует че- 
му-либо. Он просто сообщает механизму регулярных выражений оставить часті 
соответствия и действует подобно переменной $8 или ${^МАТСН}, или левой стороне 
операции подстановки. См. примеры в разделе с описанием оператора 5///. 


Существует некое перекрытие между символами, которые может находить шаблон, 
и символами, которые может интерполировать обычная строка в двойных кавычках. 
Поскольку регулярные выражения обрабатываются за два прохода, иногда возника- 
ет неоднозначность в том, на котором из этапов должен обрабатываться данный сим- 
вол. Если возникает неоднозначность, то на этапе интерполяции переменных интер- 
претация таких символов откладывается для анализатора регулярных выражений. 


Однако на этапе интерполяции переменных можно отложить интерпретацию до 
анализатора регулярных выражений, только если известно, что проводится ана- 
лиз регулярного выражения. Можно задавать регулярные выражения как обыч- 
ные строки в двойных кавычках, но тогда нужно следовать правилам, примене: 
мым к обычным строкам в двойных кавычках. Все предыдущие метазнаки, соот- 
ветствующие фактическим символам, будут работать, даже если они не отклады- 
ваются до анализатора регулярных выражений. Но нельзя использовать другие 
метасимволы в обычных двойных кавычках (или аналогичных конструкциях 
типа `...`, 09(...), 9х(...) или эквивалентных внедренных документах (Беге осо: 
тепіѕ)). Чтобы строка анализировалась как регулярное выражение без поиска со- 
ответствий, следует использовать оператор дг// (ацофе гедех. цитировать или за- 
ключить в кавычки регулярное выражение). 


С другой стороны, еѕсаре-последовательности трансляции регистра и метакавы- 
чек (\\ и компания) должны обрабатываться на этапе интерполяции переменных, 
поскольку назначение этих метазнаков состоит в воздействии на способ интерпо- 
ляции переменных. Если подавить интерполяцию переменных с помощью оди- 
нарных кавычек, не будет возможность применять и езсаре-последовательности 
трансляции. Ни переменные, ни езсаре-последовательности трансляции (\\| и про- 
чие) не разыменовываются ни в строках в одинарных кавычках, ни в операторах 
одинарных кавычек п'...' или ог’ ‘’ Даже при выполнении интерполяции эти еѕ- 
саре-последовательности трансляции игнорируются, если они фигурируют в ка- 
честве результата интерполяции переменных, поскольку в этом случае уже слиш- 
ком поздно воздействовать на интерполяцию переменных. 


Хотя оператор транслитерации не принимает регулярные выражения, любой ме- 
тазнак из обсуждавшихся нами, соответствующий конкретному отдельному 
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символу, действует и в операции 1г///. Остальные - нет (за исключением обратной 
косой черты, которая. как обычно, продолжает работать «от обратного»). 


Кон кретные символы 


Как уже говорилось выше, любой фрагмент шаблона, не обладающий специаль- 
ным назначением, соответствует самому себе. Это значит, что /а/ соответствует 
«а», /=/ соответствует «=» и т. д. Однако некоторые символы не так просто ввести 
с клавиатуры, а если вам это и удастся, они только испортят вывод текста на ва- 
шем экране (Это если повезет. Управляющие символь' славятся своим буйным 
нравом.) Чтобы справиться с этим обстоятельством, в регулярном выражении 
Рег! распознает псевдонимы символов, перечисленные в табл. 5.10. 


Таблица 5.10. Псевдонимы управляющих символов, распознаваемые 
в двойных кавычках 


Псевдоним Значение 


\0 Нулевой символ (мот, №01.) 

\а Тревога (ВЕІ, АГЕВТ) 

\е Символ экранирования (ЕЅСАРЕ, ЕЗС) 

\Е Символ новой страницы (ЕОКМ ЕЕЕР, ЕЕ) 

\п Символу перевода строки (1Е, МЕ ЕЕЕР) 

\г Символ возврата каретки (САЕВТАСЕ ВЕТОВМ, СВ) 


Символ табуляции (СНАВАСТЕЕ ТАВОГАТМ, НТ) 


Как и в строках, заключенных в двойные кавычки. Рег] дополнительно отличает 
в шаблонах следующие пять метазнаков: 


\сХ 


Именованный управляющий символ АЗСП, например, \сС для Сопёго1-С, \с7 
для Сопіго!-7, \с{ для ЕЗС и \с? для ОЕГ. Допускаются целые числа в диапазо- 
не 0—81, а также 127. 


МММ 


Символ, заданный с помощью двух- или трехзначного восьмеричного кода. 
Начальный 0 обязателен только для чисел, меньших 010 (8 десятичное), по- 
скольку (в отличие от случая строк в двойных кавычках) код из одной цифры 
всегда считается ссылкой на подстроку текста, сохраненную группой в шабло- 
не. Несколько цифр интерпретируются как 1-я ссылка, если ранее в шаблоне 
вы сохранили не менее л подстрок (где л считается десятичным числом); в про- 
тивном случае они интерпретируются как символ в восьмеричной системе. 


\ж{НЕХОТаТТ$} 


Кодовый пункт (номер) символа, заданный в виде одной или двух шестнадцате- 
ричных цифр ([0-9а-#А-Е]), например, \х18. Формат из одной цифры можно ис- 
пользовать, только если следующий символ не является шестнадцатеричной 
цифрой. Если применяются фигурные скобки, цифр может быть сколько угод- 
но. Например, \х{262#} соответствует символу Юникода «Инь – Ян» 0+262Е ум 
УАМС (©). 
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\МЛМАМЕ} 


Именованный символ, псевдоним, или последовательность; например, \№{СНЕЕК 
ЅМАШ_ ТЕТТЕВ ЕРЗТЕОМ}, \\Цодгеек:ерз1101} или \Ж№ерѕі1оп}. Чтобы такие последова- 
тельности распознавались, должна действовать прагма спагпатез, описанная 
в главе 29. Эта прагма определяет также разновидности имен, которые можно 
использовать (":Ги11" соответствует первой форме записи выше, а “:$пог 1” — 
двум другим). 

Символы можно также определять с помощью нотации \№{+МИМВЕР;. Напри- 
мер, \№0+263В) соответствует символу Ө, ВГАСК 5МПЛМС ЕАСЕ. Такое применение 
не требует прагмы спагпапез. 


Список всех имен символов Юникода можно найти в ближайшем документе 
с описанием стандарта Юникода или сгенерировать перебором сһагпатеѕ::уіа- 
соде(М№), для № в диапазоне от 0 до 0х10_РЕЕЕ, не забывая пропускать суррогатные 
символы. 


\о{МИМВЕЯ} 


Символ, определяемый восьмеричным кодом. В отличие от неоднозначной 
формы записи \Л/ММ, в этой нотации можно указывать любое количество вось- 
меричных цифр, которые никогда не будут перепутаны со ссылкой на сохра- 
няющую группу. 


Метазнаки-маски 


Три особых метазнака служат масками, каждой из которых соответствует «лю- 
бой» символ (для заранее определенных значений слова «любой»). Это метазнаки 
точки (" "), \С и \Х. Ни один из них нельзя использовать в символьных классах. 
В символьных классах не допускается наличие точки, потому что она будет соот- 
ветствовать (почти) любому существующему символу, являясь своего рода всеоб- 
щим классом символов. Если необходимо все исключить или все включить, нет 
особого смысла в использовании класса символов. Особые маски \С в \Х имеют осо- 
бый структурирующий смысл, который не очень хорошо согласуется с идеей выбо- 
ра одного символа Юникода, а именно на таком уровне работают классы символов. 


Метасимвол «точка» соответствует любому отдельному символу, кроме символа 
перевода строки. (А с модификатором 5 соответствует и ему тоже. В этом случае 
используйте метасимвол \К№ для поиска соответствия любому символу, кроме пе- 
ревода строки.) Как и для любого из двенадцати спецсимволов в шаблоне, для бу- 
квального поиска точки ее нужно экранировать с помощью обратной косой чер- 
ты. Например, следующая команда проверяет, заканчивается ли имя файла точ- 
кой и расширением из одного символа: 


іҒ (Фраһпате =- /\.(. )\2/5) { 
ѕау "Оканчивается на $1”, 


} 


Первая точка, экранированная обратной косой чертой, представляет собой лите- 
ральный символ, а вторая описывает «соответствие любому символу». Последо- 
вательность \7 указывает, что соответствие следует искать только в конце строки, 
а модификатор /з разрешает точке соответствовать и символу перевода строки. 
(Да, использование символа перевода строки в качестве расширения файла - это 
Не Очень Вежливо, но может случиться и такое.) 


218 Глава 5. Поиск по шаблону 


Метасимвол точки чаще всего используется с квантификатором. Выражение .* 
соответствует максимальному числу символов, тогда как .*? соответствует мини- 
мальному числу символов. Но иногда она применяется и без квантификатора, ра- 
ди ее ширины: выражение /(..):(..):(..)/ ищет три поля, разделенных двоеточием, 
каждое из которых имеет размер в два символа. 


Не путайте символы с байтами. В былые времена точка соответствовала единст- 
венному байту, но сейчас она соответствует символам Юникода, многие из кото- 
рых невозможно закодировать одним байтом: 


изе сһагпатеѕ дм[ :Ри11 1; 

$ВиУ[887] = “С\М{МИЗТС ЅНАВР $Т6№ т1пог“; 

ту ($пофе, $01аск, $тоде) = $Ви\( 887] =- /^([А-61)(. )\5+(\5+)/; 
зау “Так выглядит знак диез!” 11 $01аск ед сһг 0х266?; # # 


Метазнак \Х соответствует символу в более широком смысле. Он соответствует стро- 
ке из одного или нескольких символов Юникода, называемую «вгарһете сазфег» — 
кластер графем. Его назначение – захват последовательности символов, визуально 
образующих единый глиф. Обычно она состоит из базового символа, за которым 
следуют комбинационные и диакритические знаки, такие как седиль +.» и умляут 
«э, объединяющиеся с этим базовым символом в одну логическую единицу. Так- 
же это может быть последовательность Юникода, обозначающая разрыв строки, 
включая `“\г\п", или, ввиду того, что диакритики не сочетаются с концами строк, 
самостоятельный комбинационный или диакритический знак в начале строки. 


Изначальный метазнак \Х почти всегда был эквивалентен выражению (?>\РМ\рМ»), 
но это не вполне качественное определение, поэтому стандарту Юникод пришлось 
уточнить понятия кластеров графем. Точное определение достаточно сложное, но 
оно близко к следующему: 
(?> \В 
| \р{Сгарнете_Вазе} \р{бгарнете_ Ехфепа} * 
| \р{бгарпете_Ехеепа}+ | 
) 


Суть в том, что \Х ищет один видимый символ (графему), даже если для програм- 
миста этот символ состоит из нескольких отдельных символов (кодовых пунк- 
тов). Длина соответствия /\Х/ может быть больше одного символа, если ‘1 в псев- 
доопределении выше совпадет с парой СВ!Г или если базовый символ графемы 
сопровождается одним или более дополнительными символами! Неуступающая 
группировка означает, что \Х уже не передумает, обнаружив базовый символ, за 
которым следуют любые расширяющие символы. Например, \Х\2/ никогда не 
найдет "саГе\х{301}", где 0+0301 – это СОМВІМІМС АСОТЕ АССЕМТ, потому что \Х не ус- 
тупает символы механизму возвратов. 


Если вы работаете с Юникодом и действительно хотите получите один байт, а не 
один символ, можете воспользоваться метазнаком `\С. Он всегда соответствует од- 
ному байту (именно одному значению типа спаг в языке С), даже если при этом 
возникает расхождение с потоком символов Юникода. См. соответствующие пре- 
дупреждения в главе 6. Однако навряд ли это правильный путь решения задачи. 


1 Обычно комбинационные знаки; в настоящее время единственными незнаковыми гра- 


фемами, расширяющими символы, являются 7ЕБО УЛОТН МОМЈОІМЕЕ, ЕКО УЛОТЕ. ЈОІМЕЕ, 
НАТЕМЛОТН КАТАКАМА УОГСЕР ЗООМ” МАЕК И НАГЕУЛОТН КАТАКАМА ЅЕМІОІСЕР ЗО00МО МАЕК. 
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Вероятнее всего, вам следует декодировать строку в байты (т.е. в символы с кодо- 
выми пунктами ниже 256) с помощью модуля Епсоде. 


Классы символов 


При поиске по шаблону можно искать любой символ, который обладает (или не 
обладает) определенным свойством. Существует четыре способа указать символь- 
ный класс. Традиционный способ — при помощи квадратных скобок и перечисле- 
ния возможных символов, а также три способа на основе мнемонических сокра- 
щений: традиционные классы символов Регі, такие как \м, свойства Юникода, 
такие как \р{мог}, или классы обратной совместимости с РОЯХ, такие как [:мога:]. 
Каждое вхождение такого сокращения соответствует только одному символу из 
соответствующего набора. Снабдите их квантификаторами для поиска более 
длинных последовательностей. Так \0+ соответствует одной или нескольким циф- 
рам. (Естественная ошибка – считать, что \и соответствует слову. Для поиска сло- 
ва используйте \и+. Под «словом» понимается идентификатор языка программи- 
рования с подчеркиваниями и цифрами, а не слово на естественном языке.) 


Классы символов в квадратных скобках 


Перечисление символов, заключенное в квадратные скобки, называется классом 
символов и соответствует любому из символов этого списка (но только одному). 
Например, класс [ае1оиу] соответствует любой гласной букве английского языка. 
Чтобы включить в класс правую квадратную скобку, поставьте перед ней обрат- 
ную косую черту или сделайте ее первым элементом перечисления. 


Диапазоны символов могут задаваться с помощью дефиса! в формате вида а-г. 
Можно объединять несколько диапазонов. Например, [0-9а-ГА-Е] соответствует 
одной шестнадцатеричной «цифре». Можно использовате обратную косую черту. 
чтобы экранировать дефис, который иначе будет интерпретироваться как указа: 
тель диапазона, либо поместить дефис в начале или конце класса (такой подход, 
возможно, снижает удобочитаемость, но является более традиционным). 


Символ вставки ^ (или циркумфлекс, или «крышка», или *стрелка вверх») в нача- 
ле перечисления символов инвертирует класс, в результате чего он соответствует 
любому символу, не входящему в список. (Чтобы включить в класс символ ^, не де- 
лайте его первым, а лучше попросту экранируйте его обратной косой чертой.) На- 
пример, [^ае1оиу] соответствует любому символу, который не является гласной бук- 
вой английского языка. Однако будьте осторожны с отрицанием классов символов, 
поскольку вселенная символов расширяется. Например, этот класс символов соот- 
ветствует согласным, а также пробелам, символам перевода строки и чему угодно 
(включая гласные) в кириллице, греческом и почти любом другом алфавите, не го- 
воря уже обо всех китайских, японских и корейских иероглифах. А водин прекрас- 
ный день, может быть, даже в алфавитах Сігіһ и Тепеуаг?. (И уж наверняка в Ли- 
нейном письме Б и этрусском.) Поэтому, возможно, будет лучше задать согласные 
явно, например, как [сбіѓоћјкітпрагѕїумху2] или для краткости [0-0#-һј-пр-іу-2]. 


1 Фактически с помощью символа 0+0020, нүРНЕМ-МІМО5, но не 0+2010, нурНЕМ. 


2 Си (Кирт, Кертар) и Тепоугаг (Тенгвар) – изобретенные Дж. Р.Р. Толкиеном два вида 


эльфийских алфавитов — рунический (Кертар) и буквенный (Тенгвар). – Прим. ред. 
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(Это также решает проблему с латинской «у», которая должна быть одновременно 
в обоих местах, что не получится при использовании ^ — дополнения класса.) 


Внутри класса символов допускаются обычные символьные метазнаки, такие как 
\п, ХЕ, \сх, \ХхМ№, \ МММ (подразумевается восьмеричное число, а не обратная ссылка), 
\р{УЕЅРЯОР} и \МЛАМЕ}. Кроме того, в классе символов можно использовать \Б для 
обозначения забоя, так же как в строках, заключенных в двойные кавычки. 
Обычно при поиске по шаблону \р обозначает границу словг. Но утверждения ну- 
левой ширины не имеют смысла в классах символов, поэтому в них \6 возвраща- 
ется к своему обычному значению в строках. В качестве границы диапазона мож: 
но использовать любой одиночный символ, будь то литеральный символ, экрани- 
рованная последовательность вроде \ї, шестнадцатеричный или восьмеричный 
код символа, или же именованный символ. 


В символьных классах также допускается использование любых метазнаков, 
представляющих определенные наборы символов, включая инвертированные 
классы вроде \Р{МОРВОР}, \№, \5 и \0, а также предопределенные символьные клас- 
сы, описываемые ниже в этой главе (традиционные, классы Юникода или классы 
РОЅІХ). Но не пытайтесь применять их в качестве границ диапазона: это бес- 
смысленно, поэтому символ «-» будет интерпретирован буквально. Не имеет так- 
же смысла использовать нечто, имеющее длину более одного символа. Это прави- 
ло исключает \В, поскольку этот метазнак может соответствовать паре возврат 
каретки/ перевод строки; метазнак \Х, поскольку он может соответствовать не- 
скольким идущим подряд кодовым пунктам; а также некоторые именованные 
последовательности \№{МАМЕ}, эквивалентные нескольким кодам символов. 


Все остальные метазнаки утрачивают свое особое значение, находясь в квадрат: 
ных скобках. В частности, не допускается применение трех обобщающих масок: 
., \Хи \С. Первое часто вызывает удивление, но не имеет смысла использовать 
универсальный класс символов внутри ограниченного, зато часто требуется най- 
ти точку в составе класса символов, например, при поиске имен файлов. Бессмыс- 
ленно также задавать квантификаторы, утверждения или чередование внутри 
класса символов, поскольку символы интерпретируются индивидуально. Напри- 
мер, [ѓее|?іе|ғое|ғоо] означает то же самое, что и [ѓеіо|]. 


Символьный класс в квадратных скобках обычно соответствует только одному сим- 
волу. По этой причине именованные последовательности Юникода не могут при- 
меняться (с пользой для дела) в классах символов в Ре! у5.14. Они похожи на име- 
на символов, но в действительности обозначают несколько символов. Например, 
ІАТІМ САРІТАІ, ГЕТТЕВ А УЛТН МАСКОМ АМ” СВАУЕ можно использовать в конструкции 
\№Ж...}, но фактически это имя раскрывается в символ (+0100, за которым следует 
символ 17+0300. Внутри квадратных скобок эта именованная последовательность 
будет выглядеть как [\х{100}\х{300}], что навряд ли отвечает вашим желаниям. 


Однако в области действия модификатора /і символьный класс иногда может со- 
ответствовать более чем одному символу. Это обусловлено тем, что в результате 
полной свертки регистра символов единственный символ в строке может соответ- 
ствовать нескольким символам в шаблоне и наоборот. Например, следующее вы- 
ражение истинно: 


"65" =- /ТЕ\ХрЕ]$/іи 


Причина в том, что результатом свертки регистра символа 0+000Е является по- 
следовательность "55", и результатом свертки регистра строки "55" также является 
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последовательность "55". Поскольку результаты свертки одинаковы, попытка со- 
поставления завершается успехом. Однако в инвертированных символьных клас- 
сах, таких как [^\хОЕ], полная свертка заменяется простой сверткой, потому что 
иначе могут возникнуть логические противоречия. Это единственный случай, ко- 
гда в Регі используется простая свертка регистра; во всех остальных случаях ис- 
пользуется полная свертка и полное отображение регистров. 


Классические сокращенные обозначения классов в Реп 


С самого начала в Рей имелся ряд сокращенных обозначений классов символов. 
Они перечислены в табл. 5.11. Все они являются буквенными метазнаками, т.е. 
экранированы обратной косой чертой, и в каждом случае версия в верхнем реги- 
стре представляет собой отрицание версии в нижнем регистре. 


Таблица 5.11. Классические классы символов 


Свойство Перечисление Устаревший 
Сим- Обычное 
жа Значение срэвсгас с модификато- | с модификатором | класс 
ром /а /а РОЅІХ 
\а Цифра \рќХ_РОЅІХ рідії) | \р{РОЅ$ІХ рісі} | [0-9] [:91011:. 
\0 Не цифра \Р{Х_РО$ТХ_01914} | \Р{РОЗТХ 01911} | ["С-9] [:791911:] 
\м Символ слова | \р{Х_РОЅІХ Мога} | \рќРОЅІХ Мога} | [_А-2а-20-9] Смога:] 
\И Все, кроме \Р{Х_РОЅІХ Мога} | \Р{РОЅІХ Мога} | [^_А-2а-20-9] [:^мога:] 
символа слова 
\5 Пробельный |\р{Х_Рег1_Ѕрасе} | \р{Рег1 Ѕрасе} | С\і\п\#\г ] [:зрасе:]* 
символ 
\$ Непробель- \Р{Х_Рег1_Зрасе} | \Р{Рег1_Ѕрасе} Г7МЕ\п\\г ] [:^зрасе:] 
ный символ 
\№ћ Горизонталь- |\р{Ног12_5расе} |\р{Ног12 Зрасе} | Много [:61апк:] 
ный пробель- 
ный символ 
\Н Все, кроме го- | \Р{Ног17_Зрасе} | \Р{Ног17_брасе} [:761апк:] 
ризонтально- 
го пробельно- 
го символа 
\у Вертикаль- \р{\МегЕ_Зрасе} ‚р{МегЕ_брасе} Е 
ный пробель- 
ный символ 
\у Все, кроме \р{Уегї_5расе} \Р{\№егі_Ѕрасе} Э 
вертикально- 


го пробельно- 
го символа 


Круг их соответствия намного шире, чем можно себє представить, потому что 
обычно они обрабатывают полный диапазон символов Юникода, а не только АЗСП 
(причем инвертированные классы могут даже выходить за пределы диапазона 
символов Юникода). В любом случае, соответствующие этим классам наборы сим- 


* Нобез УТАВ. 
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волов обычно являются надмножеством набора АЗСП или национальных алфави- 
тов. Описание устаревших форм РОЅІХ приводится в разделе «Классы символов 
в стиле РОЅІХ» далее в этой главе. Чтобы сохранить старые значения байтов, мож- 
но использовать прагму изе ге “/а”" в текущей области видимости или добавить 
в конкретный шаблон один или два модификатора /а. 


(Да, мы в курсе, что большинство слов не содержит цифры и символы подчерки- 
вания; \и под «словами» подразумевает лексемы типичного языка программиро- 
вания. Скажем, Рей, если на то пошло.) 


Эти метазнаки могут использоваться снаружи или внутри квадратных скобок 
как самостоятельно, так и в составе конструируемого класса символов: 


ЇР ($уаг =- /\0/) { магп “содержит нецифру” } 
1 ($уаг =- /[^\м\$.]/) { магп “содержит не-(слово, пробел, точка)’ } 


Большинство из них имеют определения, соответствующие стандарту Юникода. 
И хотя внутренние механизмы Рей используют Юникод, существует множество 
старых программ, не подозревающих об этом, что может приводить к неприятным 
сюрпризам. Так, все традиционные символьные классы в Рег! страдают расщепле- 
нием личности в том смысле, что иногда подразумевают одно, а иногда — другое. 
В области действия модификатора /и двойной режим работы с набором символов 
АЗСП-Юникод отключается, и строки всегда интерпретируются, как последова- 
тельности символов Юникода. Так как это прямой путь к здравомыслию, данный 
режим используется по умолчанию в версиях Ре! у5.14 и выше. (Особенность 
ипісобе_ѕїгіпоѕ также включает режим работы с Юникодом по умолчанию.) 


Исторически сложилось так, что класс \ѕ отличается от [\\у], потому что класс \у 
включает \сК – редко используемый символ вертикальной табуляции. По этой при- 
чине класс \ѕ в языке Ре! неточно соответствует свойству \р(Мћіїеѕрасе} Юникода. 


Если вы пользуетесь старыми региональными настройками (употребляя изе 10- 
саіе или изе ге “/1”), они действуют только для символов с кодовыми пунктами 
ниже 256, но для других символов действуют обычные правила Юникода. 


При работе с кодами символов выше 255 Рег! обычно переходит на исключитель- 
но посимвольную интерпретацию. Это означает, например, чтс код 0+03А9, свЕ- 
ЕК САРГТАТ, ГЕТТЕК ОМЕСА, всегда будет соответствовать классу м. 


При использовании же модификатора /а или /за все обстоит совсем иначе. Обыч- 
но эти модификаторы используются, чтобы обеспечить корректную работу ста- 
рых шаблонов, созданных до появления Юникода. Чтобы не добавлять модифи- 
катор /а в каждый шаблон, где он необходим, можно воспользоваться следующей 
прагмой, имеющей лексическую область видимости и автоматически применяю- 
щей модификатор /а: 


изе ге "/а“; 


Это правило исключает, например, некоторые пробельные символы. Прагма так- 
же подразумевает, что не-АЗСПИ буквы из набора 150-8859-1 больше не будут счи- 
таться символами, соответствующими классу \м. 


Свойства символов 


Свойства символов доступны посредством конструкции \р{РВОР} и дополняющего 
множества \Р{РВОР}. Для семи основных свойств категорий Юникода, имена кото- 


Классы символов 223 


рых состоят из одного символа, фигурные скобки не обязательны, Так что можно 
использовать \рі для обозначения любой буквы или \р№ для обозначения числа, 
но для всех остальных свойств, таких как \р(і т} или \р{№1}, фигурные скобки яв- 
ляются обязательными. 


Большинство свойств определено непосредственно в стандарте Юникода, но неко- 
торые (как правило, составные, определенные на основе стандартных свойств) яв 
ляются специфическими для языка Рег. Например, №1 и Мп — это стандартные ка- 
тегории Юникода, представляющие буквенно-цифровые и непробельные комби: 
национные знаки, а Рег1 Ѕрасе — это собственное изобретение языка Рег]. 


Эти свойства можно использовать самостоятельно или объединять в пользова- 
тельском классе символов: 


ТЕ ($уаг =- /^\р{а1рва}+$/) { зау “одни буквы” } 
1Е ($уаг =- 5/[7\рі\р№]1//9) { зау “удалить все, кроме буквенно-цифровых” } 


Свойств существует великое множество, и некоторые из наиболее часто исполь- 
зуемых соответствуют гораздо большему количеству символов, чем можно было 
бы представить. Например, свойства а1рћа и могі, каждое в отдельности, охваты- 
вают более 100000 символов, причем свойство могі, будучи надмножеством свой- 
ства аірћа, является, как следствие, и более широким. 


Текущий список свойств, поддерживаемых вашей версией Рей, включая количе- 
ство символов, соответствующих каждому свойству, можно найти в странице 
регіипіргорѕ справочного руководства. Язык Рег] внимательно следит за развити- 
ем стандарта Оп1соде Ѕёапӣага, поэтому, как только в Юникоде появляются но- 
вые свойства, они тут же добавляются в Ре]. Официальный перечень свойств 
Юникода можно найти в приложении к стандарту Юникода «ОАХ #44: Оп1со4де 
СПпагасбег Пабафазе», а также в приложении С «Сотра у Ргорегііеѕ» техниче- 
ского стандарта «ОТ #18: Опісоде Вер\Лаг Ехргезз1юп$». Если существующих 
свойств окажется недостаточно, вы всегда сможете определить свои свойства = 
как это сделать, рассказывается в главе 6. 


К числу наиболее часто используемых свойств принадлежат основные категории 
Юникода. В табл. 5.12 перечислены все семь категорий с односимвольными име- 
нами, а также длинные формы имен и значения. 


Таблица 5.12. Основные категории Юникода (главные) 


Значение 


Краткое имя Длинное имя 
Отћег 
Іеїїег 


Магк 


Необычные управляющие и прочие символы 
Буквы и идеограммы 

Комбинационные знаки 

Митбег Числа 
Рипсїџатіоп 
бутро} 


Ѕерагаїог 


Знаки пунктуации 


Символы. знаки и обозначения 


М сг. = == 


Разделители (рағделители?) 


Каждое из этих семи свойств в действительности является псевдонимом всех ос- 
новных категорий с двухсимвольными именами, начинающимися с этой буквы. 
В табл. 5.13 приводится исчерпывающий (и замороженный) список всех основных 
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категорий. Все символы, даже еще не включенные в стандарт, принадлежат ров- 
но одной категории из перечисленных ниже. 


Таблица 5.13. Основные категории Юникода (все) 


Краткое| Длинное имя Значение 
имя 
Сс Сопёго1 Управляющие коды С0 и С1 из наборов АЗСП и БаИп-1 


СЕ Рогтаї Невидимые символы форматирования текста 
Сп Џпаѕѕ1дпед Коды, которым пока не сопоставлены символы 
Со Ргіуа+е Џѕе Свободные дла личного использования 

Сѕ Ѕиггодаїе Несимволы, зарезервированные для ОТЕ-16 

1 1 омегсазе_1еттег Маленькие символы 


т Моаіғіег Геїїег Надстрочные символы и интервальные диакритические 
знаки 


іо Отћег_Геїтег Одноместные буквы и идеограммы 


іт ТПесазе_ьеттег Заглавные буквы, используемые только в начале строки, 
например, в первом слове предложения 


Ш Оррегсазе_теттег Прописные буквы 


Мс Ѕрасіпо_Магк Маленькие комбинационные знаки, занимающие отдель- 
ное место при выводе 


Ме Епс105179_Магк Комбинационные знаки, окружающие другие символы 


Мп Мопоѕрасіпо_Магк Маленькие комбинационные знаки, не занимающие от- 
дельное место при выводе 


ма ресіта1_М№тбег Цифры 0-9 для записи чисел в системе счисления с осно- 
ванием 10 


№ егтег М№отбег Буквы, играющие роль цифр, такие как римские цифры 
№ Отһег_М№итрег Любые другие числа, такие как дроби 

Рс Соппестог_Рипсїџаїіоп | Соединительные знаки, такие как полчеркивание 

Ра раѕһ_РипсТџатіоп Любые дефисы и тире (но не «єминус») 

Ре С1оѕе_Рипстиаїіоп Знаки пунктуации, такие как закрывающие скобки 
РР РАпа1_Рипсфоа{1оп Знаки пунктуации, такие как закрывающие кавычки 
Рі Іліїіа1 Рипсїџа+іоп | Зваки пунктуации, такие как открывающие кавычки 
Ро Оћег_ РипсЕџатіоп Все остальные знаки пунктуапии 

Р5 Ореп_Рипстиа{1оп Знаки пунктуации, такие как открывающие скобки 
5с Сиггепсу_бутбо1 Символы обозначения валют 

$К Моаіғјег Ѕутро1 В основном диакритические знаки 

Эт Ма+ћ_Ѕутро? Математические символы 

50 Оїћег Ѕутро1 Все остальные символы 

211 іпе _Ѕерагаїог Только 0+2028 

2р Рагадгарһ_Ѕерагаїог | Только 0+2029 


75 Зрасе_Зерагатог Все остальные неуправляющие пробельные символы 
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Все стандартные свойства Юникода фактически состоят из двух частей: \р{МАМЕ= 
МАШЕ}. Поэтому все свойства, состоящие из одной части, являются дополнениями 
к официальным свойствам Юникода. Логические свойства со значением {гие все- 
гда можно сократить до свойств, состоящих из одной части, что позволяет, напри- 
мер, записать свойство \р{Гомегсазе=Тгие} как \р{1омегсазе}. Свойства других типов, 
кроме логических, принимают строковые, числовые или перечислимые значения. 
В языке Ре! имеются гакже псевдонимы для свойств всех основных категорий, 
алфавитов и блоков, состоящие из одной части, плюс реализуются рекоменда - 
ции первого уровня из технического стандарта Юникода «Опісойе Тесһпіса1 Ѕїап- 
дага #18, Кесиаг Ехргеззюпз» (версии 18, от 2008-08), такие как \р{Апу}. 


Например, \р{Агтеп1ап}, \р{ІѕАгтепіап} и \р{5сг1рї=Агпепіап) — это одно и то же свой- 
ство, так же как \р{іи}, \р{СС=10и}, \р{0ррегоаье Геїтег) и \р{бепега1_Сатедогу=Иррег- 
саѕе егег). В качестве других примеров логических свойств (неявнс имеющих ис- 
тинные значения) можно привести \ріИћітеѕрасе}, \рќА1рћабетіс}, \р{Маїћ} и \р{баѕћ). 
Примеры свойств других типов: \р{віді_ С1аѕѕ=Ћіоћї іо еғу}, \р(мога Вгеак=А Геїќег) 
и \р{№пегіс Ма10е=10). На странице справочного руководства рейитргорз перечис- 
лены все свойства и их псевдонимы в Рен, как стандартные, так и специфические 
для Рен. 


Результат сопоставления символа, не являющегося символом Юникода (т.е. с ко- 
дом выше 0х10ЕЕЕЕ), со свойством Юникода, не определен. Сейчас, по умолчанию, 
Рег выдает предупреждение, а сопоставление завершается безрезультатно. В не- 
которых случаях такое поведение может выглядеть довольно странно: 


сһг(0х110000) =- /\р{аһех=гие}/ # Га1зе 
сһг(0х110000) =- /\р{аһех=Ға15е}/ # Ға15е! 


сћг(0х110000) =  /\Р{авех=гие}/ # їгие 
сћг(0х110000) =- /\Р{аһех=?а1ѕе}/ # гие! 


Однако свойства, определяемые пользователем, можнс наделить любым поведе- 
нием. См. раздел «Конструирование символа» в главе 6. 
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В отличие от других сокращенных обозначений классов символов в Регі, обо- 
значения классов символов в стиле РОЅІХ, имеющие вид [:С1455:], могут исполь- 
зоваться только при создании других классов символов, т.е. внутри другой па- 
ры квадратных скобок. Например /[.,[:а1рћа:][:01014:]]/ осуществляет поиск од- 
ного символа, который является литеральной точкой (поскольку она находится 
в классе символов), или запятой, или буквой алфавита, или цифрой. Для этой 
цели также можно использовать свойства символов с теми же именами, напри- 
мер, [. \р{а1рпа}\р{91918}]. 

За исключением свойства рипсі, о котором речь пойдет в следующем абзаце, име- 
на классов в стиле РОЗ Х можно применять в свойствах вида \р{} и \Р{}, обладаю- 
щих тем же смыслом. У такого подхода два преимущества: во-первых, свойства 
проще в наборе, ведь их не требуется окружать дополнительными квадратными 
скобками; во-вторых — что, вероятно, более важно, — благодаря тому, что свойст- 
ва не подвержены действию модификаторов кодовых страниц, они всегда соот- 
ветствуют символам Юникода. В то же время запись вида [[:..:]] для классов 
РОЗІХ, напротив, делает их подконтрольными флагам модификаторов. 
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Свойство \р{рипсї) отличается от РОЗІХ-класса [[:рипст:]] тем, что \р{рипс*} нико- 
гда не соответствует символам, не являющимся знаками пунктуации, а класс 
[:рипст:]] @ свойства \рќРОЅІХ_Рипсї} и \р{Х_РОЗТХ_Рипс®}) соответствует. Это обу: 
словлено тем, что стандарт Юникода разбивает единую РОШ Х-группу знаков 
пунктуации на две категории: знаки пунктуации и символы. В отличие от \р{рипс{}, 
другие свойства, упомянутые выше, также будут соответствовать символам, пе- 
речисленным в табл. 5.14. 


Таблица 5.14. АЗСП-символы, интерпретируемые как знаки пунктуации 


Название 


Категория 


$ 0+0024 8С=Соттоп РОШ.АВ 91СМ 

+ 0+002В 8С=Соштоп РІАЈ8 СМ 

< 0+003С 5С=Сотитоп 1.Е85-ТНАМ ЗЮМ 

= 0+008р эС=Соттоп ЕСОАІ5 8163 

> 0+008Е ЗС=Соттоп СЕЕАТЕЕ-ТНАМ 5ІСМ 


85С=Соттоп СЕВСОМЕГЕХ АССЕМТ 


0+005Е 
0+0060 
0+007С 
0+007Е 


5С=Соштоп СВАУЕ АССЕМТ 


5С=Соттоп УЕВТІСАІ. МЕ 


ТП.рЕ 


8С=Соттор 


Можно считать, что класс [[:рипсї:]] соответствует всем символам, которые в Юни- 
коде считаются знаками пунктуации (когда действуют правила интерпретации 
символов Юникода), плюс еще девяти знакам пунктуации из диапазона АЗСП, 
перечисленным в табл. 5.14, которые в Юникоде считаются символами. 


В первой колонке табл. 5.15 приведены классы РОЗГХ, доступные в у5.14. 


Таблица 5.15. Классы символов РОЗТХ 


Класс | Обычное значение Значение с модификатором /а? 


Строго [А-2а-20-9]. Эквивалентен 
свойству \р{РО$ТХ_А1пиь,.^ 


а1пип | Любой алфавитно-цифровой символ, т.е. любой 
символ а1рћа или 01911. В том числе множество 
символов, не являющихся буквами — см. сле- 
дующую строку таблицы. Эквивалентен свой- 
ству \р{Х_РОЗТХ_А1пим}. 


Любой алфавитный символ вообще, включая 
все буквы, плюс другие символы со свойством 
О+ћег_А1рћһабеїіс, такие как римские цифры, 
символы букв в кружочках и комбинационный 
знак «йота» греческого алфавита. Эквивален- 
тен свойству \р{Х_РОЗТХ_А1 рва}. 


Строго 52 АЗСП-символа [А-4а-2]. 
Эквивалентен свойству \р{РОЗТХ_ 
А1рһа}.* 


а1рћа 


Любой символ с числовым кодом 
0-127. Эквивалентен свойству 
\р{АЅСІТ).* 


Только пробел или табуляция. 
Эквивалентен свойству \ріР051Х_ 
ВЛапк}. 


Только символы с числовыми кодами 0-127. 
Эквивалентен свойству \р{АЗСТТ}. 


аѕсіі 


Бапк | Любой горизонтальный пробельный символ. 
Эквивалентен свойствам \р{Х_РОЗТХ_В1апк} 


и \р{Ног125расе}, а также \ћ. 


Классы символов 


Класс | Обычное значение 


спе 


01911 


Огарћ 


10мег 


ргіпї 


рипст 


зрасе 


Любой символ со свойством Сопіго1. Обычно 
символы из этого класса не генерируют вывод 
как таковой, но оказывают некоторое управ- 
ляющее воздействие на терминал. Например, 
они отвечают за переводы строк, разрыв стра- 
ниц и забой. В это множество в настоящее вре- 
мя входят все символы с кодовыми пунктами 
0-31 и 127-159. Эквивалентен свойству \р{Х_ 
РОЅІХ_Спіг1}. 


Любой символ со свойством 01011. Технически 
говоря, этом символы со свойством Мипег1с_ 
Туре=0есітг1, занимающие непрерывные диапа- 
зоны длиной 10 символов, числовые значения 
которых последовательно возрастают от 0 до 9 
(Митег1с_\Уа1ие=0..9). Эквивалентен свойству 
\р{Х_РОЗТХ_01911} или \а. 


Любой не-Мћіїеѕрасе символ, не входящий в ка- 
тегории Сопіго1, Ѕиггодаїе и Упаз$19пес. Эквива- 
лентен свойству \р{Х_РОЗТХ_@гарН}. 


Любой символ нижнего регистра, не только бу- 
квы. Включает все символы из категории 1омег- 
сазе_1е{тег, плюс символы со свойством Оїћег 
1 омегсазе. Эквивалентен свойству \р{Х_РОЗТХ_№о- 
мег} или \р{[омегсазе}. С модификатором /1 так- 
же соответствует любому символу с СС=1С, 
сокращенному обозначению любого из 6С=\и, 
бС=ї и 0С=11. 


Любой символ из класса дгарћ или не входящий 
в классы спіг1 и б1апк. Эквивалентен свойству 
\р{Х_РОЗТХ_Рг1п{}. 


Любой символ из категории Рипстиаїіоп, плюс 
девять АЗСП-символов из категории 5уто1. Эк- 
вивалентен свойству \р{Х_РО$ТХ_Рипс{} или \рР. 


Любой символ со свойством Иһіїеѕрасе, вклю- 
чая табуляцию, перевод строки, вертикальную 
табуляцию, перевод страницы, возврат карет- 
ки, пробел, неразрывный пробел, следующая 
строка, узкий пробел, тонкая шпация, разде- 
литель абзацев Юникода и еще великое множе- 
ство других. Эквивалентен свойству \р{Х_РО$ТХ_ 
Ѕрасе}, [\\\!] или $\сК]; класс \ѕ сам по себе эк- 
вивалентен свойству \р{Хх_Рег1_брасе}, если из 
последнего выбросить соответствие \скК, т.е. 
вертикальную табуляцию. 
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Значение с модификатором /а^ 


Любые символы с кодовыми 
пунктами 0—31 и выше 127. Экви- 
валентен свойству \р{РОЅ1Х Спіг1). 


10 символов от «0» до «9». Экви- 
валентен свойству \р{Р051Х_0ідії» 
или \9 с модификатором /а. 


Множество АЗСП-символов, ми- 
нус пробельные и управляющие, 
т.е. любые символы с числовыми 
кодами в диапазоне 88—126. Эк- 
вивалентен свойству \р{РОЗТХ_ 
бгарһ}. 


Только 26 букв АСП в нижнем 
регистре [а-2]. С модификатором 
/1 также включает [А-7]. Эквива- 
лентен свойству \ріРОЅІХ І омег}.* 


Любой символ из класса дгарћ 
или не входящий в классы спїгі 
и Б1апк. Эквивалентен свойству 
\р{РОЗТХ. Ргіпё}.* 


Любой АЗСП-символ из катего- 
рии Рипсїџаїіоп или Ѕупро1. Экви- 
валентен свойству \р{РОЗТХ_Рипс*} 


Любой АЗСП-символ со свойст- 
вом Мһітеѕрасе, включая табуля- 
цию, перевод строки, вертикаль- 
ную табуляцию, перевод страни- 
цы, возврат каретки и пробел. 
Эквивалентен свойству \р{РОЗТХ_ 
Ѕрасе}; в самом классе \$ отсутст- 
вует вертикальная табуляция. 
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Таблица 5.15 (продолжение) 


Класс! Обычное значение | Значение с модификатором /а^ 


Любой символ верхнего (не заглавного) регист- Только 26 букв АЗСП в верхнем 


иррег 
ра, не только буквы. Включает все символы из регистре [А-2]. С модификатором 
категории Џррегсаѕе_ {І еїїег, плюс символы со! /і также включает [2-2]. Эквива- 
свойством Оїћег. Џррегсаѕе. С модификатором /і | лентен свойству \р{РОЗТХ_Иррег}.* 
также соответствует любому символу, в котором 
верхний регистр совпадает с результатом сверт- 
ки. Эквивалентен свойству \р{Х_РО$ТХ_Оррег} 
или \р{Иррегсазе}. 

мога | Любой символ из класса а1пип и из категорий | Любая буква АБЗСПИ, цифра или 
Магк и Соппестог_ Рипсёџаїтіоп. Эквивалентен свой- | символ подчеркивания. Эквива- 
ству \р{Х_РОЗТХ_Мога} или \м. Обратите внима-| лентен свойству \р(РОЅІХ_ Мога} 
ние, что идентификаторы с символами Юнико- | или \м с модификатором /а.^ 
да, в том числе и в языке Регі, следуют собствен- 
ным правилам: первый символ должен иметь 
свойство І0 $1агї, а все последующие – свойство 
ТО Сопїіпое. (Язык Регі также допускает в каче- 
стве первого символа идентификатора символ со 
свойством Соппестог_Рипстиа оп.) 

х0191ї | Любая шестнадцатеричная цифра, либо одно- | Любая шестнадцатеричная циф- 


байтные символы АСИ, либо соответствующие | ра из набора АЗСП. Эквивален- 
многобайтные символы. Эквивалентен свойству | тен классу [0-9А-Ға-ї], свойству 
\р{Х_РОЅІХ_Хрідії), \р{Нех_0191{} или \р{нех}. \р{РОЗТХ_ХО191т}, \р{АЗСТТ_Нех_ 
01911) или \р{апех}. 


Классы из таблицы, помеченные символом *, могут также соответствовать неко- 
торым не-АЗСП символам при использовании модификаторов /аі. В настоящее 
время к таковым относятся: 


Г О+017Е 6С=11 9С=атіп ІАТІМ 5МАІІ | ЕТТЕВ + 0№ 5 
К 1+212А СС=и 5С=атіп КЕЕМТМ 5ІСМ 


Первый символ при свертке регистра преобразуется в обычный символ 45» ниж- 
него регистра, а второй – в обычный символ «К» нижнего регистра. Имеется воз- 
можность подавить такое поведение. продублировав модификатор /а: /аа:. 


Можно создать отрицание (или дополнение) РОЅІХ-класса символов, поместив 
перед именем класса и сразу после [: символ ° (это расширение Регї), как показа- 
но в табл. 5.16. 


Таблица 5.16. РОГ Х-классы символов и их эквиваленты в Рей 


Классический 
[79191] 
[:^ѕрасе:] 
[:7мога:] 


\5 


Квадратные скобки являются частью конструкции класса символов в стиле 
РОЅІХ [::], а не частью класса символов в целом. Поэтому можно писать такие 
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шаблоны, как /^[[:10\ег:][:91911:]]+$/ для поиска строки, состоящей только из 
букв в нижнем регистре или цифр (и, возможно, замыкающего символа перевода 
строки). В частности, следующая команда не работает: 


42 =- /7[:01911:]6/ # НЕВЕРНО 


Это неверно, потому что РОЅІХ-класс здесь находится не внутри класса символов. 
Но это класс символов, представляющий символы «:», «і», «і», «5» и «д». Рег! без- 
различно, что символ «:» задан дважды. 


Вот что нужно было написать в действительности: 
42 =- (70:01911: 11+$/ 


РОЅІХ-классы символов [.сс.] и [=сс=] распознаются, но порождают ошибку, в ко- 
торой сообщается, что они не поддерживаются. 


Квантификаторы 


Если не указано иное, то для каждого элемента в регулярном выражении отыски- 
вается только одно соответствие. Для такого шаблона, как /пор/, должны быть 
найдены все эти символы, один за другим. Такие слова, как «рапоріу» и «хепо- 
рһоЫа» соответствуют шаблону, потому что не имеет значения, где именно в стро- 
ке расположено соответствие. 


Если необходимо обеспечить соответствие пары слов «хепорноЫа» и «Бпоору», то 
шаблон /пор/ использовать нельзя, поскольку он требует наличия только одной 
буквы «о» между «п» и «р», а в слове «Зпоору» их две. В таких случаях на помощь 
приходят квантификаторы: они сообщают, сколько раз что-то должно присутст- 
вовать, тогда как по умолчанию ищется лишь одно соответствие. Квантификато- 
ры в регулярном выражении - как циклы в программе. В действительности, если 
представить себе регулярное выражение как программу, они и есть циклы. Не- 
которые циклы точные, типа «повторить это соответствие ровно пять раз» ({5}). 
Другие задают нижнюю и верхнюю границы счетчика соответствий, типа «по- 
вторить это соответствие не меньше двух, но не больше четырех раз» ({2,4}). Неко- 
торые вообще не определяют верхнюю границу, вроде «не менее двух соответст- 
вий, но сколь угодно много» ({2, }). 


В табл. 5.11 перечислены квантификаторы. которые Ре! распознает в шаблоне. 


Таблица 5.17. Квантификаторы в регулярных выражениях 


Максимальный | Минимальный | Неуступающий | Допустимый диапазон 


{МТМ, МАХ} {МТМ, МАХ}? { МТМ, МАХ} ?+ Не меньше МТМ соответствий, но не 
больше МАХ 

{МІМ, } {МІМ, }? {МТМ 2+ Не меньше МГ/ соответствий 

{СОимт} {СОиМТ}? {СОиМТ}?+ Ровно СОИМТ соответствий 


Р +7 ++ 0 или более соответствий (то же, что 


и {0,}) 


1 или более соответствий (то же, что 
и {1.}) 


0 или 1 соответствие (то же, что и {0,1} 
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Конструкция, сопровождаемая квантификатором * или ?, фактически не обязана 
иметь соответствие в строке. Дело в том, что соответствие может произойти 0 раз, 
что будет засчитано за положительный результат. Квантификатор + часто подхо- 
дит лучше, поскольку предполагает хотя бы одно соответствие. 


Пусть вас не смущает использование в предыдущей таблице слова «ровно». 
Оно относится только к счетчику повторений, а не к строке в целом. Например, 
фп =- /\0{3}/ не означает: «Равна ли длина строки ровно трем цифрам?» Здесь 
спрашивается, есть ли в $п место, где подряд идут три цифры. Строка "101 Моггіѕ 
Ѕїгееї" удовлетворяет этому, как и строки "95472" и "1-800-555-1212". Все они содер- 
жат три цифры в одной или нескольких позициях, и это все, о чем мы спрашива- 
ли. Для закрепления прочитайте раздел «Позиции» далее в этой главе, где опи- 
сывается использование позиционных утверждений (как в /^\9{3} $/)- 


Имея возможность найти варьирующееся число соответствий, максимальные 
квантификаторы выбирают максимальное число повторений. Поэтому, когда мы 
говорим: «Столько раз, сколько угодно», жадный квантификатор интерпретиру- 
ет это как «сколько сможешь унести», ограничиваясь лишь требованием, чтобы 
это не помешало поиску соответствий, согласно оставшимся спецификациям 
шаблона. Если в шаблоне есть два неограниченных квантификатора, то, очевид- 
но, оба они не могут «съесть» строку целиком: символы, которые использует одна 
часть соответствия, становятся недоступными части, следующей за ней. В этом 
случае квантификаторы демонстрируют жадность, обделяя следующие за ними, 
при этом шаблон читается слева направо. 


Это привычное поведение квантификаторов в регулярных выражениях. Однако 
Рег] позволяет нам изменить поведение своих квантификаторов: поместив ? после 
квантификатора, мы превратим его из максимального в минимальный. Это не 
значит, что минимальный квантификатор всегда будет давать соответствие, со- 
стоящее из минимального числа повторений, разрешенных в его диапазоне, как 
не означает и того, что максимальный квантификатор всегда будет находить мак- 
симальное число соответствий, допустимое в его диапазоне. Успешным должно 
быть соответствие шаблону в целом, и минимальное соответствие возьмет столь- 
ко, сколько нужно, чтобы быть успешным, и не более. (Минимальные квантифи- 
каторы удовлетворение ценят выше жадности.) 


Например, при поиске 

“ехазрегате” =- /е(.*)е/ # $1 содержит теперь хазрегат” 
подвыражение .+ соответствует подстроке “хазрега{" – самой длинной из возмож- 
ных. (Это значение также записывается в $1, как будет видно из раздела «Захват 
и группировка» далее в этой главе.) Хотя имелось более короткое соответствие, 


при жадном поиске это не важно. Если в одной и той же точке есть возможность 
выбора, всегда возвразцается более длинный вариант. 


Сравните это со следующим: 
“ехазрегате” =- /е(. *?)е/ # $1 содержит теперь “хазр” 
Здесь применяется минимальная версия поиска, .*7. Добавление ? к» заставляет 


*? вести себя противоположным образом: теперь, если в одной точке есть выбор из 
двух возможностей, всегда возвращается более короткая из них. 


Хотя можно прочесть *? как «искать ноль или более чего-то, но предпочтительно 
ноль», это не значит, что всегда будет отыскиваться ноль символов. Будь это так, 
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и внашем примере $1 была установлена в , не нашлась бы вторая "е", поскольку 
она не следует за первой непосредственно. 


Вы можете поинтересоваться, почему при минимальном поиске /е(.*?)е/ Регі не 
поместил в переменную $1 строку "гаї". Ведь "гаї" тоже находится между двумя 
"в" и короче “хазр". В Ре] выбор между максимальным и минимальным происхо- 
дит только при наличии альтернатив соответствия, причем когда все они имеют 
одну и ту же начальную точку. Если есть два возможных соответствия, но начи- 
наются они на разном смещении от начала строки, их длины не играют роли, как 
и то, какой квантификатор используется – минимальный или максимальный. 
Из нескольких возможных соответствий побеждает всегда то, которое встрети- 
лось раньше. Лишь если несколько возможных соответствий начинаются в од- 
ной и той же точке, для принятия решения используется минимальное или мак- 
симальное соответствие. А если начальные точки различаются, то и решать нече- 
го. Обычно Рег| ищет самое левое длиннейшее соответствие; при минимальном 
поиске оно становится самым левым кратчайшим. Часть «самое левое» всегда 
постоянна и является доминирующим критерием.! 


Есть два способа преодолеть «левый уклон» поиска по шаблону. Во-первых, мож- 
но использовать сначала жадный квантификатор (обычно .+), чтобы постараться 
«проглотить» начальные части строки. При поиске соответствия для жадного 
квантификатора сначала отыскивается самое длинное соответствие, в результате 
чего оставшаяся часть строки просматривается справа налево: 


“ехазрегате” =- /. *е(. *?)е/ я $1 теперь содержит "гаї" 


Но будьте осторожны, поскольку общий результат поиска теперь содержит всю 
строку вплоть до этой точки. 


Вторым способом преодоления стремления влево является использование пози- 
ционных утверждений, обсуждаемых в следующем разделе. 


Как можно изменить максимальное поведение квантификатора на минимальное, 
добавив после него 7, точно так же максимальное поведение можно изменить на 
неуступающее, добавив после квантификатора +. Неуступающие квантификато- 
ры позволяют управлять механизмом возвратов. Оба квантификатора, мини- 
мальный и максимальный, всегда осуществляют перебор всех возможных комби- 
наций при поиске соответствия. Неуступающий квантификатор никогда не усту- 
пит уже совпавшие символы, чтобы позволить найти другую возможную комби- 
нацию, за счет чего способен существенно повысить скорость сопоставления. 


С простыми сопоставлениями проблема производительности возникает нечасто, 
но с увеличением количества квантификаторов, особенно вложенных, она начи- 
нает приобретать все большее значение. Обычно применение неуступающих кван- 
тификаторов не влияет на общий успех сопоставления, если он возможен, но если 
сопоставление должно завершиться безрезультатно, они позволят достичь отри- 
цательного результата быстрее. Например, такое сопоставление: 


Не все механизмы обработки регулярных выражений действуют таким образом. Неко- 
торые веруют во всепоглощающую жадность, при которой всегда побеждает самое 
длинное соответствие, даже если оно находится дальше от начала строки. Ре! не таков. 
Можно сказать, что рвение сильнее жадности (или расчетливости). Более формальное 
обсуждение этого и многих других принципов можно найти в разделе «Маленький Ме- 
ханизм, который /(не)? может/». 
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(7а" х 20 67) =- /(ағағаға*а«ағаға*аға*ака*)« 7ВЬ]$/ 


в конечном счете, не даст результатов. Нс механизму регулярных выражений при- 
дется немало потрудиться, чтобы опробовать все возможные комбинации, допус- 
каемые квантификаторами. Он не понимает, что поиск в данном случае обречен на 
неудачу. Изменив один или несколько максимальных квантификаторов * на неус- 
тупающий *+, можно заставить поиск завершиться намного быстрее. В данном 
случае, изменив последний максимальный квантификатор «звездочка» на неус- 
тупающий, можно получить неудачный результат раз в сто быстрее — достаточно 
серьезный прирост скорости. 


Безусловно, это достаточно надуманный пример, но при создании сложных шаб- 
лонов подобная необходимость может возникнуть совершенно естественным пу- 
тем. Оказывается, неуступающие квантификаторы действуют точно так же, как 
неуступающие группы, с которыми мы познакомимся ниже. Выражение а*+ с не- 
уступающим квантификатором эквивалентно выражению (?>а‹). Неуступающие 
группы обеспечивают чуть больше гибкости, чем неуступающие квантификато- 
ры, потому что позволяют объединять совпавшие фрагменты в неделимые груп- 
пы, недоступные для механизма возвратов. Но неусгупающие квантификаторы 
проще набирать с клавиатуры, и зачастую их вполне достаточно, чтобы предот- 
вратить катастрофическую деградацию производительности, обусловленную ра- 
ботой механизма возвратов. 


Позиции 


Некоторые конструкции в регулярных выражениях символизируют позиции 
в строке, которые должны быть найдены. Позиция — это место слева или справа 
от фактического символа. Эти метазнаки являются примерами утверждений ну- 
левой ширины, поскольку они не соответствуют фактическим символам строки. 
Часто мы называем их просто утверждениями (аѕѕегііопѕ). (Они называются так- 
же точками привязки, или якорями (апсћһогѕ), поскольку привязывают какую-то 
часть шаблона к определенной позиции.) 


Есть возможность манипулировать позициями в строке без использования шаб- 
лонов. Встроенная функция ѕибѕіг позволяет извлекать подстроки и осуществ- 
лять присваивание подстрокам, измеряемым от начала строки, от конца строки 
или с конкретного числового смещения. Этого может оказаться достаточно при 
работе, например, с записями фиксированной длины. Шаблоны необходимы, 
только если числового смещения недостаточно. Но чаще всего смещений недоста- 
точно или, по крайней мере, они недостаточно удобны в сравнении с шаблонами. 


Начало строки: утверждения \А и ^ 


Утверждение \А соответствует только началу хранящегося в переменной текста, 
каким бы она ни был. Утверждение же ^ всегда соответствует началу хранящего- 
ся в переменной текста, но может соответствовать и началу любой строки, кото- 
рую этот текст содержит. Если в шаблоне используется модификатор /п, а текст 
содержит внедренные символы перевода строки, ^ будет также соответствовать 
любому месту в строке сразу за символом перевода строки: 
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/ЛАбаг/ # Соответствует “Баг” и "рагѕїоо1" 
/^раг/ # Соответствует “Баг и "рагѕїоо1" 
/баг/т # Соответствует “Баг” и "багѕїтоо1" и “запд\пбаг” 


В сочетании с модификатором /9 модификатор /п позволяет находить соответст- 
вие метасимволу ^ многократно в одной и той же строке: 


5/7\5+//9т; # Обрезать ведущие пробельные символы во всех строчках 
$гоТа1++ мђі1е /7. /то; # Подсчитать непустые строчки 


Конец строки: утверждения \2, \2 и $ 


Метазнак \2 соответствует концу текста независимо от ее содержания. \2 соответ- 
ствует позиции перед символом перевода строки в конце текста, если этот символ 
там есть, и позиции в конце текста, если такого символа нет. Метасимвол $ обыч- 
но имеет тот же смысл, что и \7. Однако с модификатором /п, при наличии в тек- 
сте символов перевода строки, $ может соответствовать любому месту в тексте пе- 
ред символом перевода строки: 


Гоої\2/ # Соответствует “гобот 

/оот\2/ # Соответствует "горої’ и “арбої\п" 

/001$/ # Соответствует “гобоЕ” и "аррої\п” 

/боф/т # Соответствует “гобот” и "аррот\п” и “гобої\пги1еѕ" 
/"горої$/ # Соответствует “гобоф” и "горої\п” 

/7 горот ф/т в Соответствует “гобот” и "гобої\п” и "Еһіѕ\пгорої\п” 


/\Агобої\2/ # Соответствует ° горо?” и "горої\п“ 
МХАгобої\2/ 8 Соответствует только “гобот” - почему бы не использовть ед? 


Как и для ^, модификатор /п позволяет находить соответствие $ многократно в од- 
ном и том же тексте, если задан модификатор /9. (В следующих примерах предпо- 
лагается, что в $ считана запись из нескольких строк; возможно, перед чтением 
придется присвоить переменной $/ пустую строку ``.) 


3/\5*$//9дт; # Обрезать замыкающие пробелы во всех строках абзаца 


мһі1е (/^([7:]+):\$*(.*)/дт ) { # получить заголовок почтового сообщения 
$һеадегѕ{$1} = $2; 
} 


В разделе «Интерполяция переменных», далее в этой главе, мы расскажем, как 
интерполировать переменные в шаблонах: если $ѓоо имеет значение "рс", то выра- 
жение /а$Ғоо/ эквивалентно выражению /абс/. Здесь $ не соответствует концу 
строки. Чтобы метасимвол $ соответствовал концу строки, он должен быть в кон- 
це шаблона, либо сразу за ним должна следовать вертикальная черта или закры- 
вающая скобка. 


Границы: утверждения \Б и \В 


Утверждение \6 соответствует любой границе слова, определяемой как позиция 
между символом \м и символом \М, в любом порядке. Порядок \\\м соответствует 
границе начала слова, а порядок \м\И — границе конца слова. (Концы строки рас- 
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сматриваются здесь как символы \\.) Утверждение \В соответствует любой пози- 
ции, которая не является границей слова, т.е. находится в середине \м\м или \И\И. 


/\0із\/ # Соответствует "мћаї ії 15” и “їһаї 1$ 11" 

/\В1ѕ\В/ # Соответствует "іһіѕї1е” и "агтіѕї" 

Г\019\8/ # Соответствует “1$Тапби1” и ѕо-іѕп т їћаї биїїег? 
Г\Віѕ\Ь/ # Соответствует "сопѓоїаїіѕ" и “тефгоро11$ пеаг уои” 


Поскольку \И включает все знаки пунктуации (кроме подчеркивания), границы 
\6 присутствуют в середине таких строк, как “15п'{”, роокіесћёогеі11у. сот”, “М.Т.Т.” 
и "Кеу/ма1ие". 


Внутри класса символов ([\0]) знак \0 представляет символ забоя, а не границу 
слова. 


Последовательный поиск 


В области действия модификатора /д функция роѕ позволяет читать или устанав- 
ливать смещение для следующей попытки поиска: 


ФБигоЛаг = “81160 Ваддіпѕ”; 
мһіЛе (Фоиго1аг =- /6/9д1) { 

ргіпї? "Найдена `В” в позиции %0\п", роѕ($оџгд1аг)-1; 
} 


(Мы вычитаем из позиции единицу, поскольку ищем длину строки, а роѕ всегда 
указывает на позицию после найденного соответствия.) 


Вышеприведенный код выдает: 


Найдена `В’ в позиции 0 
Найдена 'В' в позиции 3 
Найдена 'В` в позиции 6 


После безрезультатного поиска позиция обычно обнуляется. Если дополнительно 
указать модификатор /с (от слова «сопёіпие», продолжить), то, когда очередной 
поиск с модификатором /д окажется неудачным, указатель позиции не будет об- 
нулен. Это позволяет продолжить поиск с текущей точки, а не начинать его с са- 
мого начала. 


$Биго1аг = "Ві1бо Ваддіпѕ ; 
мһі1е (Фоигд1аг =- /0/9сі) { в А00 /с 

ргіпіҒ "Найдена `В’ в позиции %4\п”, ро$($биго1аг)-1 
} 
мпі1е ($бигоТаг =- /1/91) { 

ргіпі? "Найдена ‘`Т” в позиции %0\п”, ро$($биго1аг)-1 
} 


Помимо трех В, найденных ранее, Рег! сообщает теперь об 1, найденной в позиции 
10. Без /с вторая попытка поиска в цикле началась бы с начала и была бы обнару- 
жена еще одна і в позиции 1. 


Где вы остановились: утверждение \С 


При мысли об использовании функции роѕ возникает соблазн разделить строку 
с помощью функции ѕи0ѕіг, но такой подход редко бывает правильным. Чаще, если 
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уж мы начали с поиска по шаблону, то лучше так и продолжить. Но если вы оза- 
дачились позиционным утверждением, то, вероятно, вам нужен метасимвол \б. 


Утверждение \б представляет в спецификации шаблона ту же точку, которую 
функция роз представляет за ее пределами. Если мы осуществляем последова- 
тельный поиск в строке с модификатором /0 (или воспользовались функцией роз 
для непосредственного выбора начальной точки), то можем использовать \б для 
определения позиции сразу за предыдущим найденным соответствием. Иначе го- 
воря, это утверждение соответствует месту непосредственно перед тем символом, 
текущая позиция которого будет определена посредством роз. Это позволяет за- 
помнить, где мы остановились: 


(Фгес1ре = <<'ОТ$Н”) =- з/^\$+//ст; 
Ргеһеаї оуеп то 451 дед. Ғаһгепһћеії 
Міх 1 т1. ЧИТЕНТим міїћ З ох. №аС1 апа 
5їіг 1п 4 апспоу1еѕ. б1а7е мати 1 0. 
пегсигу. Неаї Рог 4 ћоигѕ апо 1еї соо] 
Ғог З ѕесопаѕ Ѕегуеѕ 1С а11епз. 

рІЅН 


Фгесіре =- /\9+ /9, 
фгесіре =- /\6(\и+)/, Е $1 теперь “дед” 
$гес1ре =- /\9+ /9; 
фгесіре =- /\б(\м+)/; в $1 теперь “пт” 
фгесіре =- /\а+ /д; 
фгесіре =- /\@(\м+)/; # $1 теперь 02” 


Метасимвол \б часто применяется в цикле, как показано в следующем примере. 
Мы «останавливаемся» после каждой цифровой последовательности и проверя- 
ем, нет ли за ней аббревиатуры. Если есть, захватываем два следующих слова, 
в противном случае только одно следующее слово: 


роѕ($гесіре) = 0, # На всякий случай сбросим \б6 в 0 
Фгесіре =- /(\0+) /9 ) { 
ту $атоџпЕ = $1; 


1+ ($гесіре =- / \@ (\м{0,3}) .. \5+ м { в сокращ. + спово 
зау “Фатоипе $1 о? $2" 

} езе { 
фгесіре =- / \6 (\м+) /х; # просто слово 


ѕау “Фатоипф $1: 


} 
В результате получается: 


451 дед о? Ғаһгепће1ї 
1 ті о? ді1і+һіцт 

3 02 ОЁ №01 

4 апсһоуіеѕ 

1 о ОҒ мегсигу 

4 Воиг$ 

3 зесопдз 

10 а1іепѕ 
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Захват и группировка 


Существует возможность части шаблонов в подшаблоны и запоминать строки, со- 
ответствующие этим подшаблонам. Первое мы называем группировкой (Егоир- 
іпр), а второе — захватом (саріигіпа). Группировку можно производить и без за- 
хвата, но об этом мы поговорим позже. 


Захват 


Чтобы сохранить подстроку для дальнейшего ее использования, заключите в круг- 
лые скобки соответствующую этой подстроке часть шаблона. Первая пара скобок 
сохраняет соответствующую подстроку в переменной $1, вторая пара - в $2 и т. д. 
Скобок может быть сколько угодно; Рег! создает нужное количество нумерован- 
ных переменных, представляющие захваченные строки. 


Некоторые примеры: 
/(\9)(\9)/ # Найти две цифры, захватив их в $1 и $2 
/(\9+)/ # Найти одну или более цифр, захватив их все в $1 
/(\8)+/ # Найти цифру один или более раз, захватив последнюю в $1 


Обратите внимание на различия между вторым и третьим шаблонами. Обычно 
требуется то, что делает вторая форма. Третья форма не создает несколько пере- 
менных для нескольких цифр. Скобки нумеруются на этапе компиляции шабло- 
на, а не на этапе поиска соответствий. 


Захваченные строки часто называют ссылками на группы (Егоир геегепсез), по- 
скольку они ссылаются на части захваченного текста. Исторически сложилось 
так, что механизмы сопоставления с шаблоном ограничивают возможность ссы- 
латься на группы исключительно обратными ссылками (Баскгеѓегепсеѕ), но в Реті 
можно ссылаться на любые группы, как находящиеся позади текущей позиции 
в шаблоне, так и впереди, и даже на текущую группу. 


Существует два способа получить эти ссылки. Нумерованные переменные, кото- 
рые мы только что описали, позволяют получать обратные ссылки за пределами 
шаблона, но в самом шаблоне они не работают. В шаблоне же приходится исполь- 
зовать нотапию обратных ссылок: \1, \2, \9{1}, \9{2}, \К зоте_дгоир>, \* сотпег_9гоцр> 
ит.д. 


Выражение вроде $1 не позволяет сослаться на группу внутри шаблона, потому 
к моменту компиляции регулярного выражения эта конструкция уже будет ин- 
терполирована как обычная переменная. Поэтому внутри шаблонов следует ис- 
пользовать традиционную запись \1. Двухзначные и трехзначные номера обрат- 
ных ссылок создают неоднозначность, поскольку такая форма записи совпадает 
с восьмеричной формой определения символов. Рег] элегантно решает эту пробле- 
му, ориентируясь на количество сохраняющих групп в шаблоне. Например, если 
Механизм обнаруживает метасимвол \11, то считает его эквивалентом ссылки $11, 
только если прежде в шаблоне будет сохранено как минимум 11 подстрок. В про- 
тивном случае значение интерпретируется как \011 – т.е. как символ табуляции. 
Чтобы избежать подобной неоднозначности, для ссылок на сохраняющие груп- 
пы используйте форму \9{МИМВЕР}, а для определения кодов символов в восьмерич- 
ном виде — форму \о{ОСТМИМ}. Благодаря этому \9{11} всегда будет интерпретиро- 
ваться как ссылка на 11-ю сохраняющую группу, а \0{11} — как символ с кодовым 


Захват и группировка 237 


пунктом 11 в восьмеричной системе. Однако еще лучше использовать именован- 
ные группы, как описывается ниже. 


Итак, чтобы отыскать повторяющиеся слова, такие как “Пе тпе“ или "Паб пад’, 
можно использовать следующий шаблон: 


ИА\Б(\и+) \1\0/1 


Но чаще всего вы будете прибегать к форме $1, потому что обычно после примене- 
ния шаблона выполняются некоторые действия с найденными подстроками. До- 
пустим, имеется некоторый текст (почтовый заголовок), который выглядит так: 


гот: дпат@рег1. сот 

То: сање10ї@огеі11у. сот 

Бафе: моп, 17 Чи 2011 09:00:00 _1000 
Ѕибјесі Еуе ог їһе пеед1е 


и требуется создать хеш, отображающий текст перед каждым двоеточием в текст 
после него. Если организовать построчный перебор этого текста в цикле (напри- 
мер, при чтении из файла), создать хеш можно так: 


мһіЈе (<>) { 
/7(.*?): (.+)5$И; # Текст до двоеточия - в $1, после него - в $2 
фғіе105{$1} = $2 

} 


Подобно $`, $8 и $ эти нумерованные переменные имеют динамическую область 
видимости, простирающуюся до конца охватывающего блока или строки еуа1 ли- 
бо до следующего успешного поиска по шаблону, в зависимости от того, что встре- 
тится раньше. Нумерованные переменные можно также использовать в правой 
(заменяющей) части операции подстановки: 


5/7(\5+) (\$+)/$2 $1/; # Поменять местами первые два слова 


Группы могут быть вложенным, и в этом случае нумерация групп производится 
согласно положению левой скобки. Поэтому для строки «Ргити]а ВгаидуБисК» 
шаблон 


(Ом) (\и+))$/ 


захватит “Рг1ти]1а Вгапдубиск” в $1, "Ргітџиа” в $2 и "Вгапдуриск” в $3. Это отражено 
на рис. 5.1. 


СОР) (+) $/ 


Рис. 5.1. Создание ссылок на найденный текст с помощью круглых скобок 
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Как упоминалось выше, ссылки на группы не обязаны быть обратными ссылка- 
ми. Допускается ссылаться на любые группы, имеющиеся в шаблоне, даже если 
они еще не были сопоставлены тексту. Эта возможность полезна только для мно- 
гократных обращений к одной и той же ссылке на группу. Первое обращение 
к опережающей ссылке на группу закончится неудачей, поскольку сопоставле- 
ние с этой группой еще не произошло. Но в последующих попытках ссылка мо- 
жет содержать что-нибудь интересное для вас. 


Ниже приводится три типа ссылок на сохраняющие группы. Первый тип - тра- 
диционные обратные ссылки, которые будут связаны с реальными данными 
к моменту обращения к ним: 


"Ғооғообаг" =- /^(Роо)\Лбаг$/ # обратная ссылка 
Следующий тип — опережающие ссылки: 
“Тоофообаг” =- /7((\Зраг) | (+00) )+$/ # опережающая ссылка 


К моменту первого обращения по ссылке \3 мы даже не начали сопоставление, 
поэтому попытка получить подстроку по ссылке \3 потерпит неудачу и будет вы- 
полнен переход ко второй альтернативе, которая заполнит третью группу первой 
строкой "Гоо”. При следующей попытке квантификатора + продолжить сопостав- 
ление обращение по ссылке \3 вернет строку “Гоо", и работа завершится сопостав- 
лением с подстрокой “Баг”. 


В третьем примере ссылка не является ни обратной, ни опережающей, потому 
что находится внутри группы, на которую ссылается, в результате возникает сво- 
его рода циклическая ссылка: 


"Ғооғообаг” == /^(\ЛБах | (Ғоо))+/ # циклическая ссылка 


Шаблоны с сохраняющими группами часто применяются в списочном контексте 
для заполнения списка значениями, поскольку шаблон достаточно «сообразите- 
лен», чтобы возвращать захваченные подстроки в виде списка: 


($Ғ1гѕї, $1а51) = /7(\м+) (\м+)$/, 
($Ри11, ФРагэф, $1а51) = /7((\м+) (1н) )8/; 


При наличии модификатора /д шаблон может вернуть несколько подстрок не- 
скольких найденных соответствий в едином списке. Предположим, что текст поч- 
тового заголовка, который мы видели выше, целиком хранится в одной строке 
(скажем, в $_). То, что делает наш построчный цикл, можно реализовать одной 
командой: 


%11е19$ = /^(.*?): (.*)$/дт; 


Этот шаблон находит четыре соответствия, и в каждом обнаруживает две под- 
строки. Поиск с модификатором /оп возвращает их все в плоском списке из вось- 
ми строк, которые операция присвоения списку %ѓіе1йѕ удачно интерпретирует 
как четыре пары ключ/значение, восстанавливая таким образом гармонию во 
Вселенной. 


Есть еще несколько специальных переменных, относящихся к тексту, захвачен- 
ному при поиске по шаблону. $8 содержит всю найденную строку, $` содержит все, 
что находится слева от соответствия, $ — справа, а $+ содержит текст в последней 
сохраняющей группе. 
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$ = "Скажи <ЕМ>друг</ЕМ>, и войдешь ”; 

п (<.*?>) (.=?) (</.*?>) ]х; # Тег, затем символы, затем закрывающий тег 
ѕау "ргетаїсһћ: $`”: # Скажи 

зау "таїсһ: $&7"; # <ЕМ>друг</ЕМ> 

зау "роѕітаїсһ: $‘; # и войдешь. 

зау "Іаѕїтаїсһ: $+"; й </ЕМ 


Описание этих волшебных переменных (и способ их написания по-английски) 
приводится в главе 25. 


Массив @- (61 АЅТ МАТСН_5ТААТ) содержит смещения начал всех подчиненных соот- 
ветствий, а массив @+ (© АЅТ_МАТСН_ЕМ№) содержит смещения концов: 


#1 /иѕг/о1п/рег1 

иѕе Реафиге "ѕау"; 

фа1рһабеї = "арсдеғоһіјкітпордгѕёиумхух"; 
фа1рпареї =- /(һі). *(510)/ 


зау “Соотвегствие в целом началось в $-[0] и закончились в $+[0]” 
зау “Первое соответствие началось в $-[1] и закончилось в $+[1]"; 
ѕау “Второе соответствие началось в $-[2] и закончилось в $+[2]”, 


Если действительно требуется найти буквальный символ скобки. а не интерпре- 
тировать его как метасимвол, поставьте перед ним обратную косую черту: 


/\(т.е. .*?\)/ 


Это соответствует примеру в скобках (т.е. данному уточнению). Но поскольку точ- 
ка является групповым символом, это соответствует и любому уточнению в скоб- 
ках с первой буквой т и третьей буквой е (т.е. и этому утверждению). 


Нумерованные сохраняющие группы чрезвычайно чувствительны к изменениям 
в шаблоне. Представьте, что имеется следующее выражение для поиска повто- 
ряющихся слов: 


Фаирмога = дг/ \6 (? ( \м+ ) (2: \5+ 1% Би; 


Если встроить его в более крупный шаблон, имеющий свои сохраняющие группы 
перед этим шаблоном поиска повторяющихся слов, тогда ссылка \1 окажется 
ошибочной. Например, следующий пример не даст ожидаемого результата: 


$аџотед = 9г{ ([ `1 ) $дирмога ^^ }х 


потому что теперь, после встраивания в шаблон $4и0{ед, шаблон в фаирмога должен 
использовать ссылку 2. Но это невозможно, потому что на момент компиляции 
шаблона $@ирмога вторая сохраняющая группа отсутствует, и компиляция за- 
кончится неудачей. 


Данную конкретную проблему в принципе решают сохраняющие группы с от- 
носительной нумерацией. Для доступа к ним следует использовать нотацию 
\9{МИМВЕЯ}, которая указывает на сохраняющую группу с номером МИМВЕВ. Когда 
МИМВЕВ — положительное число, данная форма записи совпадает с формой \МИМВЕР. 
Но когда МИМВЕР — отрицательное число, оно указывает на предшествующую груп- 
пу, причем отсчет ведется от текущей позиции в шаблоне в сторону начала. То 
есть \9{-1} – это последняя сохраняющая группа, \9{-2} — предпоследняя и т.д. 


Учитывая вышесказанное, шаблон поиска повторяющихся слов, который пред- 
полагается встраивать в более крупные шаблоны, лучше будет определить, как 
показано ниже: 
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$аџрмога = аг/ ХО (?: (\м+) (7: \5+ \9{-1) )+ ) ХЫ /хі; 


А вот простая программа поиска повторяющихся слов в последовательности аб- 
зацев: 


#1 /иѕг/оіп/епу рег1 
иѕе у5. 14; 


пу $Фирмога = дг{ \6 ( \м+ ) (7: \5+ \0{-1) )+ \6 }хі; 
ту $диоїед = аг ( [1] ) $дирмога \1 }х; 
$/ = 90); # через абзацы 


мһі1е (<>) { 
мпіле (/Фаиотей/рд) { 
рг1пЕЕ “№5 %9: %5\п , ЗАЯбУ, $., Ф{7МАТСН}; 


} 
} сопііпџие { 

с1оѕе АВСУ 1? ест; 
} 


Эта программа прекрасно справляется со своими обязанностями, однако пробле- 
ма никуда не делась. Если встроить $ди0*е4 в еще более крупный шаблон, его 
ссылка \1 также станет неверной, И в нем сложно будет рассчитать, сколько групп 
следует отступить в обратном направлении, потому что неизвестно, сколько 
групп имеется во вложенном шаблоне $дирмого, никак с ним не связанном. 


Именованные сохраняющие группы 


Единственный способ решить эту последнюю проблему — использовать иную 
стратегию, вообще не использующую нумерованные группы. Для этой цели 
(и многих других) мы изобрели именованные сохраняющие группы. Объявление 
именованной сохраняющей группы в шаблоне выполняется с помощью конструк- 
ции (2<МАМЕ>...). Это обычная сохраняющая группа, которая имеет собственное 
имя МАМЕ. 


Или, точнее, она имеет еще и имя МАМЕ, потому что именованные сохраняющие 
группы нумеруются так же, как обычные, неименованные сохраняющие груп- 
ны, и наряду с ними. Таким поведением именованные группы обладают в боль- 
шинстве библиотек поддержки регулярных выражений для Јауа и Руіћоп. Одна- 
ко поведение именованных групи несколько отличается в .МЕТ ЕтатемогК, на- 
пример, в языке Сё, где порядковые номера именованным группам назначаются 
только после присваивания номеров всем нумерованным группам. (А в другом 
странном языке, Рей 6, сохраняющая группа получает имя, только если она не 
имеет другого имени. Поди разбери.) 


Обратные ссылки на именованные группы в том же самом шаблоне записывают- 
ся с использованием конструкции \К<ЛМАМЕ>. Теперь можно вернуться к определе- 
нию шаблона $4и01е0, который доставлял нам неприятности, и подготовить его 
к интеграции в более крупные шаблоны: 


Фацотед = дг{ (2?<чиоте> [°`] ) $дириога \К<аиоте> }х; 


Внутри шаблона все выглядит прекрасно, но, как раньше выполнялось обраще- 
ние к группе \1 посредством переменной $1 после применения шаблона, вам мо- 
жет потребоваться обратиться к содержимому именованной группы за пределами 
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приведенного оператора. Этой цели служит встроенный хеш %+. Его ключами яв- 
ляются имена сохраняющих групп в шаблоне, а значениями – фрагменты текста, 
захваченные этими группами. То есть, принимая во внимание предыдущие опре- 
деления $диотед и $дирмого, извлечь все последовательности повторяющихся слов 
можно следующим образом: 


зау $+{дџиоїе} мһі1е /$аџоїей/9; 
Вот еще один пример: 


фмога = "рооккеерег"; 
фмога =- $/ (?<1еїїег> \р{а1рһа} ) \К<1Іеїтег> /$+{1е1Тег} /91х; 
# $мога теперь содержит “Бокерег” 


(Модификатор /х использован здесь, только чтобы получить возможность доба- 
вить пробелы в шаблон и сделать его более удобочитаемым. Малокомупонравит- 
сячитатьтакойтекст.) 


Если так случится, что в одном шаблоне окажется несколько групп с одинаковы- 
ми именами, в хеш %+ попадет только первая сохраненная строка, однако имеется 
другой хеш, %-, хранящий ссылки на массивы сохраненных соответствий. При 
наличии нескольких групп с одинаковыми именами, для получения содержимо- 
го всех групп используйте @{$-{МАМЕ}}, где $- {МАМЕ} [0] хранит соответствие первой 
группе, $-{МАМЕ} [1] — второй, и так далее, вплоть до последней, $- {МАМЕ} [-1]. 


Представьте, что требуется отыскать имена, за которыми следуют числа, или на- 
оборот — числа, за которыми следуют имена. Если использовать нумерованные 
сохраняющие группы, возникает проблема — как выяснить, какие группы ис- 
пользовать: 


/ (\а+) \5+ (\рі+) | (\рі+) \з+ (\9+) /х 


Поскольку неизвестно, какая из ветвей сработала, нельзя определить, какие 
группы содержат интересующее нас соответствие - $1 и $2 или $3 и $4. В подобных 
случаях может пригодиться конструкция сброса ветви (?|...): 


т{ 
(71 (\9+) \з+ (\рі+) # эти "руппь доступны как $1 и $2 
| С\рЕ+) \ѕ+ (\9+) # и эти группы тоже! 
) 


}х 


В каждой из ветвей перечисления нумерация групп начинается сначала, с числа, 
предшествовавшего входу в конструкцию выбора ветви. В этой ситуации неваж- 
но, с какой половиной будет обнаружено соответствие, поскольку известно, что 
в данном случае соответствия будут доступны по ссылкам $1 и $2. 


Этот способ хорошо подходит для простых шаблонов, но использование имено- 
ванных сохраняющих групп позволяет справиться с задачей еще лучше, даже 
в более сложных шаблонах. Если дать группам имена, как показано ниже: 


т{ 
(?<паме> \рі+ ) \ѕ+ (?<питрег> \@+ ) 
| 
(?<питрег> \@+ ) \5+ (?<пате> \рі+ ) 
}х 
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можно совершенно не волноваться о том, какой вариант в перечислении обнару- 
жит соответствие. Обратиться к группам после сопоставления можно будет, как 
показано ниже: 


ф+{пате} 
$+{питбег} 


Однако без ветвления обе сохраняющие группы окажутся заполненными дважды: 


п{ 
(?<пате> \рі+ ) \$+ (?<питрег> \а+ ) 
Хин 
(?<питрег> \0+ ) \5+ (?<пате> \рі+ ) 
}х 


То есть если найдется соответствие шаблону, на каждую группу. <пате> и <питоег>, 
придется по два соответствия. Когда обнаруживается более одного соответствия 
для одной именованной группы, предыдущее содержимое переменной %+ не заги- 
рается; изменение ее значения происходит только при первом присваивании. Од- 
нако переменная %- хранит массивы значений для каждого имени в хеше, поэто- 
му все последующие соответствия будут просто добавляться в конец анонимного 
массива, связанного с именованным ключом. 


Поскольку значениями в %- являются ссылки на массивы, а не строки, как в %+, 
имеется возможность получить обнаруженные соответствия в иде множества, 
как показано ниже: 


@{ $-{пате} } 
@{ $-{питрег} } 


или как отдельные скаляры: 


$- {папе}; [0] 
$- {пате} [1] 
$- {питбег} [0] 
$- {питбег} [1] 


Отсюда следует, что $+{пате} хранит то же значение, что $- (пате}[0]. 


К слову, если вам не по душе переменные, имена которых состоят изединственно- 
го знака препинания, можно воспользоваться стандартным модулем Т1е: :Наѕп::№- 
педСарїиге, который позволяет определять любые имена для этих двух встроен- 
ных хешей. Если вы захотите получить версию, которая действует как перемен- 
ная %-, передайте дополнительный аргумент а11 = 1, в противном случае вы по- 
лучите связанный хеш, который действует подобно переменной %+. 


иѕе Тіе: : Наѕћ: : №атедСарїиге; 
їіе пу ЖРігѕї саріигеа, “Т1е: :Назй: :МатедСар®иге"; 
їіе ту %а11 сарёџигеа, "Тіе: :Наѕћ: :МатедСаріиге", а11 => 1; 


Теперь к соответствиям именованных групп можно обращаться посредством этих 
переменных, как при использовании %+ и %-, но с другими именами. 


$Е1г$+_сартигед {пате} 
$Е1гзт_сарфигед {питрег} 


@{ $а11 сарфигед {папе} } 
@{ $а11_сартигед {питбег} } 
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фа11 сарфиге4{пате} [0] 
Фал1. сарфигед {пате} [1] 


$а11 _сарфигед {питбег} [С] 
фа11 сарїџгед{ питрег} [1] 


Продемонстрированные приемы использования именованных сохраняющих 
групп должны были убедить вас в их превосходстве над группами нумерованны- 
ми в любых шаблонах, кроме самых простых (кто-то скажет, что и в самых про" 
стых тоже). Однако по-настоящему все свои преимущества именованные сохра- 
няющие группы начинают раскрывать при использовании в рекурсивных шабло- 
нах и грамматиках, описываемых ниже, в разделе «Замысловатые шаблоны». 


Группировка без сохранения 


Голые скобки и группируют, и сохраняют. Но иногда это не требуется. Бывает, 
достаточно просто сгруппировать части шаблона, не создавая ссылки на найден- 
ный текст. Можно использовать расширенную форму скобок для подавления со- 
хранения: выражение (?:РАТТЕП№) выполняет группировку без сохранения. 


Есть по крайней мере ри причины, по которым может потребоваться группиров- 
ка без сохранения: 


1. Чтобы квантифицировать части шаблона. 


2. Чтобы ограничить область видимости внутреннего перечисления; например, 
шаблон /7саїсом|009$/ должен стать /7(?:саі|сом|00)$/, чтобы кошка (сай) не 
убежала с ^. 


8. Чтобы ограничить область действия модификатора шаблона конкретным под- 
шаблоном, как, например, в /#00(?-і:Саѕе_ Маїїегѕ)баг/і. (См. следующий раз- 
дел, «Замкнутые модификаторы шаблонов».) 


Кроме того, отказ от сохранения того, что мы не собираемся использовать, повы- 
шает производительность. Отрицательной стороной является несколько более за- 
мусоренный внешний вид шаблона. 


Применение в шаблоне левой круглой скобки и непосредственно за ней вопроси- 
тельного знака означает расширение регулярного выражения. Бестиарий регу- 
лярных выражений в настоящее время относительно фиксирован, и мы не осме- 
ливаемся создать новый метасимвол из опасения нарушить работу старых про- 
грамм на Регі. Вместо этого для добавления в бестиарий новых функций исполь- 
зуется синтаксис расширения. 


В оставшейся части этой главы мы увидим много других расширений регуляр- 
ных выражений, которые группируют без сохранения, а также делают что-то 
еще. Особенность расширения (?:РАТТЕА№) как раз в том. что оно ничего больше не 
делает. Поэтому высказывание: 


@ғіе105 = $р114(/\6 (2 :а16|с)\6/) 
похоже на: 
@ғїіе105 = ѕр1іж(/\Ы(а[[с)\/) 


но не возвращает ненужные поля. (Оператор 5р11ї немного похож на п//д в том, 
что выдает лишние поля для всех строк, захваченных в шаблоне. Обычно $р1ії 
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возвращает только то, чему соответствий не найдено. Дополнительные сведения 
о $р11( содержатся в главе 21.) 


Замкнутые модификаторы шаблонов 


Действие модификаторов /і, /т, /з, /х, /0, /и, /а, /1 м /р можно ограничить лексиче- 
ской областью видимости, поместив их (без обратной косой черты) между симво- 
лами? и. в расширенном определении группы. Если сказать: 


/Нагғу (71:5) +гитап/ 
то это будет соответствовать обеим строкам, "Наггу 5 Тготап” и "Наггу $ Тгипап”, в то 
время как: 
/Наггу (2х: [А-2] \.7 \5 )?Тгитап/ 
соответствует "Наггу 5 Тгитап” и "Наггу $. Тгитап”, а также "Наггу Тгитап”, а шаблон: 
/Наггу (?1х: [А-2] \.? \$ )?Тгитап/ 
соответствует всем пяти строкам, объединяя /1 и /х внутри группы. 
Модификаторы можно «вычитать» из областей видимости с помощью знака «ми- 
нус»: 
/Наггу (7х-1: [А-2] \.? \ѕ )?Тгитап/і 
Это соответствует любому сочетанию заглавных и строчных букв в имени, но ес- 
ли имя содержит средний инициал, он должен быть заглавной буквой, поскольку 


действие модификатора /1, примененного к шаблону в целом, отменяется внутри 
группы. 


Выключать таким образом разрешено только модификаторы /1, /п, /з или /х. Ос- 
тальные модификаторы, /1, /ц, /а, /1 и /р, можно только включать. 


Опустив двоеточие и РАТТЕРМ, можно эксиортировать установки модификаторов 
в охватывающую группу, превратив ее, таким образом, в область видимости. Это 
означает, что можно избирательно включать и выключать модификаторы для 
группы, непосредственно охватывающей данную, например: 


/(21)Ғоо/ # Эквивалентно /Ёоо/і 
/#00((?-і)баг)/і # “Баг” должно быть в нижнем регистре 
/Р00((?х-1) Баг)/ # Включает /х и отключает /1 для “Баг” 


Обратите внимание, что во втором и третьем примерах создаются сохраняющие 
группы. Если они не нужны, следует примените (?-і:раг) и (?х-1: баг), соответст- 
венно. 


Ограничение действия модификаторов фрагментом шаблона особенно полезно, 
когда необходимо, чтобы точка (.) соответствовала символам перевода строки 
в некоторой части шаблона, но не во всем шаблоне. Установка /ѕ для всего шабло- 
на для этих целей бесполезна. 


Перечисление 


Внутри шаблона или подшаблона метасимвол | служит для определения набора 
возможностей, любая из которых считается соответствием. Например: 


/бапда1# | Загитап | Вададаѕтї/ 
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соответствует бапда1{ или Ѕагипап, или Кададазт. Перечисление простирается до 
ближайшей охватывающей группы (которая может быть как сохраняющей, так 
и несохраняющей): 


/ргоб|п| гі аїе/ # Соответствует ргоо, п, г, 1 или аїе 
/рго(Ыіп|г|1)ате/ # Соответствует ргобафе, ргопафе, ргогате или рго1ате 
/рго(? :61іпіғ11)ате/ # Соответствует ргорате, ргопаїе, ргогаїе или рго1ате 


Вторая и третья формы ищут эквивалентные соответствия, но во второй форме 
переменный символ сохраняется в $1, а в третьей - нет. 


В каждой данной позиции Механизм регулярных выражений пытается найти со- 
ответствие с первой альтернативой, затем со второй и т. д. Длина альтернатив не 
имеет значения, поэтому в шаблоне: 


/(Ѕат| Ѕапміѕе)/ 


переменнан $1 никогда не получит значения Ѕатіѕе, в какой бы строке ни произ- 
водился поиск, поскольку всегда сначала будет найдено соответствие альтернати- 
ве Ѕап. Осуществляя такой поиск с перекрывающимися альтернативами, поме- 
щайте более длинные альтернативы в начало шаблона. 


Но порядок альтернатив имеет значение только в данной позиции. Внешний цикл 
Механизма регулярных выражений осуществляет поиск слева направо, поэтому 
следующее выражение всегда соответствует первой альтернативе Зап: 


“бат І ат, заза Ѕатм1ѕе” =- /(Ѕати1ѕе |Зат) /; # $7 ед "Зат" 


Однако можно предписать просмотр справа налево — при помощи жадных кван- 
тификаторов: 


"бат І ат, ° за19 Запмузе” =- /. «(Ѕапміѕе |бат)/, # $1 ед "Ѕатіѕе" 


Можно обойти эффекты направления поиска при просмотре слева направо (или 
справа налево) посредством различных позиционных утверждений, рассмотрен- 
ных нами выше, таких как \б, 7 и $. Здесь мы привязываем шаблон к концу строки: 


"'’бат І ат, зѕа10 Затиззе”“ =- /(Ѕатм15е |бат)$/; # $1 ед `Ѕати156" 


В этом примере $ выносится за скобки перечисления (поскольку у нас уже есть 
парочка скобок, после которых можно его поместить). но и в отсутствие скобок 
можно расставить утверждения перед некоторыми или всеми имеющимися аль- 
тернативами соответственно тому, какое соответствие для них нам требуется. 
В следующей маленькой программе выводятся все строки, начинающиеся с лек- 
сем __ ПАТА__ или __ ЕМ: 


#1 /иѕг/ріп/рег1 
мһі1е (<>) { 

ргіпЕ 11 /^_ РАТА |7__ЕМО_/; 
} 


Но будьте начеку. Помните, что первая и последняя альтернативы (перед первым 
символом | и вслед за последним) стремятся «поглотить» все элементы регуляр- 
ного выражения с той или с другой стороны вплоть до конца выражения, если нет 
охватывающих скобок. Часто встречается такая ошибка: 


/сат | а09 | сом$/ 
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когда в действительности имеется в виду: 
/^ (са 1909 [с0м)$/ 


Первый шаблон находит "сат" в начале строки или "000" в любом месте, или "сом" 
в конце строки. Второй соответствует любой строке, состоящей только из "саї" 
или "409", или "сом". Он также сохраняет результат в переменной $1, что может 
быть нам не нужно. Избежать сохранения можно одним из двух способов: 


/саї$ [7009$ |^сои$/ 
(70 :саї | доо |сом)$/ 


Альтернатива может быть пустой, и в этом случае она всегда соответствует тексту. 


/сот(роипа | )/; # Соответствует "сотроџпа" или "сот" 
/сот(роипа($|)1)/; # Соответствует “сотроипаз”, "сотроипд” или “сот” 


Это похоже на использование квантификатора ?. который находит нуль соответ- 
ствий или одно соответствие: 


/сот(роџпа)?/; я Соответствует “сотроипд” или “сот” 
/сот(роип@($?))?/; # Соответствует “сотроипдз”, “сотроџпа” или “сот” 
/сот(роипӣѕ?)?/, # То же, но не использует $2 


Однако есть одно отличие. Когда ? применяется к шаблону, осуществляющему со- 
хранение соответствия в нумерованной переменной, эта переменная остается не- 
определенной, если в нее не попадает никакая строка. При использовании пустой 
альтернативы она тоже ложная, но определена, и в ней находится нулевая строка. 


Управление процессом 


Всякому хорошему руководителю известно, что не следует чрезмерно опекать 
своих подчиненных. Нужно просто указать им, что требуется, и позволить самим 
определять, как лучше всего этого добиться. Аналогично и регулярное выраже- 
ние зачастую выгоднее всего считать указанием высокого уровня: «Вот что мне 
нужно; найди-ка мне подходящую строку». 

С другой стороны, лучшие руководители также разбираются в той работе, кото- 
рую пытаются сделать их подчиненные. То же самое верно в отношении поиска 
по шаблону в Регі. Чем глубже мы понимаем, как Рег! решает задачу поиска по 
некоторому шаблону, тем разумнее мы сможем использовать возможности Рег] 
для поиска по шаблону. 


Один из наиболее важных моментов в поиске но шаблону в Ре! заключается 
в том, чтобы понять, когда его применять не нужно. 


Пусть Рей делает свое дело 


У людей с определенным темпераментом знакомство с регулярными выражения- 
ми вызывает соблазн любую задачу рассматривать как задачу поиска по шабло- 
ну. И хотя это может быть и верно в широком смысле, но поиск по шаблону — это 
нечто большее, чем простое вычисление регулярных выражений. Отчасти это ре- 
шение искать ключи от машины там, где вы их уронили, а не под уличным фона- 
рем, где лучше видно. И в повседневной жизни мы все понимаем, что значительно 
более успешен поиск в правильном месте. 


Управление процессом 247 


Точно так же следует применять операторы Ре! для управления потоком выпол- 
нения, чтобы указывать, какие шаблоны выполнять, а какие – пропустить. Регу- 
лярные выражения довольно сообразительны, но это сообразительность лошади. 
Если она видит сразу слишком много, ее внимание может рассеяться. Поэтому 
иногда нужно надевать на нее шоры. Вспомните приведенный ранее пример пере- 
числения: 


/бапада1? | Загитап | Вададаѕї/ 


Он работает так, как обещано, но не так хорошо, как мог бы, поскольку Меха- 
низм ищет все имена в каждой позиции строки, прежде чем перейти к следую- 
щей позиции. Сообразительные читатели «Властелина колец» вспомнят, что из 
трех названных магов Гэндальф упоминается значительно чаще, чем Саруман, 
а Саруман упоминается значительно чаще, чем Радагаст. Поэтому обычно для пе- 
ребора ветвей логические операторы Ре! более эффективны: 


/Гэндальф/ || /Саруман/ || /Радагаст/ 


Это еще один способ преодолеть «левый уклон» Механизма. При этом Сарумана 
мы ищем, только когда не видно Гэндальфа. А Радагаста ~ только когда Сарума- 
на тоже нет. 


Это позволяет не только изменить порядок поиска объектов, но и (иногда) улуч- 
шить работу оптимизатора регулярных выражений. Обычно проще оптимизиро- 
вать поиск отдельной строки, чем одновременный поиск нескольких строк. Ана- 
логично и не слишком сложный поиск с привязкой тоже часто поддается оптими- 
зации. 


Не обязательно ограничивать управление потоком выполнения одним операто- 
ром ||. Часто управление возможно на уровне целых операторов. Всегда следует 
сначала исключать общие случаи. Допустим, мы пишем цикл для обработки 
файла настройки. Многие файлы с операторами настройки состоят, в основном, 
из комментариев. Часто лучше всего сразу выбросить комментарии и пустые 
строки, прежде чем приступать к интенсивной обработке, даже если эта интен- 
сивная обработка выбрасывает комментарии и пустые строки по ходу дела: 


мһі1е (<СОМР>) { 
пехі 1! /7#/; 
пехї і /^\з*(#1$)/; 
сһотр; 
типсһарипсћ($_); 

} 


Даже если мы не стремимся к повышению производительности, часто требуется 
чередовать обычные выражения Ре! с регулярными выражениями просто пото- 
му, что необходимо выполнить какие-то действия, которые невозможно (или 
трудно) выполнить из регулярного выражения, например осуществить вывод. 
Вот полезный классификатор чисел: 


мага “содержит нецифры” 1 /\0/; 

магп “не натуральное число” ип]езз /7\0+$/; # отвергает -3 
магп “не целое число" ип1е$$ /^-?\9+$/; # отвергает +3 
магп "не целое число” џп1е95 /7[+- ]2\0+$/; 


магп “не десятичное числс” џп1еѕ5 /7-?7\0+\.7\0»*$/; # отвергает .2 
магп "не десятичное числс” џп1е55 /^-?(2:\9+(?:\.\9*)? |\.\0+)$/; 
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магп “не вещественгое число языка С“ 


ип1еѕѕ /7 ([+- 7? )(?=\а1\.\а)\а* (\.\9*)?([Ее]([+- 170+) )3$/; 


Можно было бы надолго растянуть этот раздел, но, в действительности, такого 
рода вещам посвящена вся книга. По ходу изложения мы увидим многочислен- 
ные примеры взаимодействия кода Рег] и поиска по шаблону. В частности, имеет- 
ся в виду раздел «Программные шаблоны» далее в этой главе. (Конечно, мы не 
против, если сначала вы прочитаете материал, предшествующий этому разделу.) 


Интерполяция переменных 


Применение механизмов управления потоком выполнения Регі для управления 
поиском с использованием регулярных выражений имеет свои ограничения. Ос- 
новная сложность в том, что это подход типа «все или ничего»; либо мы выполняем 
шаблон, либо нет. Иногда общие черты требуемого шаблона ясны, но желательно 
иметь возможность его параметризации. Такую возможность предоставлнет ин- 
терполяция переменных, подобно тому, как параметризация подпрограммы по- 
зволяет в большей мере оказывать влияние на ее выполнение, чем просто решать, 
вызывать ее или нет. (Подробнее о подпрограммах рассказано в следующей главе.) 


Одно из элегантных применений интерполяции состоит в том, чтобы создать не- 
которую степень абстракции и при этом повысить удобочитаемость. Посредством 
регулярных выражений можно, несомненно, добиться краткости записи: 


ЇР (Фпит == /7[-+12\9+\.7\9*$/) { } 


Но наши намерения становятся более очевидными, если записать так: 


$5191 = '[.-+]?°: 

$910118 = '\9+°; 

фдес1та1 5:7 

фтоге_91914$ = '\0*'; 

$питрег = "$$191$91911$$9ес1та1$тоге_91911$5” 


іг (пит =- /^фпитрегф/о) {.. } 


Мы еще поговорим о таком использовании интерполяции в разделе «Генерируе- 
мые шаблоны» далее в этой главе. Здесь же отметим, что при помощи модифика- 
тора /о мы запретили повторную компиляцию шаблона, поскольку предполага- 
ем, что Фпитег не будет изменять свое значение во время выполнения программы. 


Другой изящный прием состоит в том, чтобы вывернуть проверки «наизнанку» 
и задать переменную строку для поиска по шаблону в наборе известных заранее 
строк: 


спотр(Ф$апзмег = <5Т0ІМ№ ), 

11 (“ЗЕ№О” =- /^\Офапѕмег/і) { зау "Асііоп 15 зеид” } 
еїѕіғ (“”5ТОР” =- /7\0$апѕмег/і) { зау “Асііоп 1$ ѕїор” } 
е151Ғ ("АВОВТ" =- /^\0$апѕмег/і) { зау “Ас\1оп 1$ абогт” } 
е1ѕіҒ (“1ТУТ” =- /^\0$апзиег/1) { ѕау “АсТоп 1$ 1151” } 
е151Ғ (“”ЕОТТ” =- /^\0$апзиег/1) { зау “Ас 1оп 1$ е0дії” } 


Этот код позволяет выполнять действие «ѕепд», вводя любую строку из 5, 5Е, ЗЕМ 
или ЅЕ№ (произвольно чередуя верхний и нижний регистры). Для действия «ѕіор» 
нужно ввести, по крайней мере, 571 (или 51, или $7, или $1). 
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Когда встречается обратная косая черта 


Рассматривая интерполяцию строк в двойных кавычках, мы обычно имеем в ви- 
ду интерполяцию переменных и обратной косой черты. Но, как уже говорилось, 
регулярные выражения обрабатываются в два этапа, и на этапе интерполяции 
интерпретация обратной косой черты, по большей части, откладывается для об- 
работки анализатором регулярных выражений (который мы обсудим ниже). 
Обычно мы не замечаем разницы, поскольку Ре! берет на себя труд ее скрыть. 


В действительности очень важно, чтобы анализатор регулярных выражений об- 
рабатывал символ обратной косой черты, потому что только он знает, когда \6 
обозначает границу слова, а когда символ забоя. Или, допустим, мы выполняем 
поиск символов табуляции по шаблону с модификатором /х: 


($с011, $5012) = /(.*?) \4+ (.*?)/х; 


Если бы Рен не откладывал интерпретацию \ї до анализатора регулярных выра- 
жений, то \{ обратился бы в пробельный символ, который анализатор регуляр- 
ных выражений и проигнорировал бы из-за модификатора /х. Но Рен не настоль 
ко подл или коварен. 


Однако есть риск перехитрить самого себя. Предположим. что мы абстрагирова- 
ли разделитель колонок таким способом: 


$с01зер = “\{+', # (двойные кавычки) 
($со11, $с012) = /(.*?) $со1ѕер (.*?)/х; 


Ну вот мы все и испортили, потому что \ї превратится в действительный символ 
табуляции, прежде чем попадет на вход анализатора регулярных выражений, ко- 
торый будет считать, что мы сказали /(.*?)+(.*?)/, после того как выбросит про- 
бельные символы. Чтобы исправить положение, не применяйте /х или исполь- 
зуйте одинарные кавычки. А лучше обратитесь к 0://. (См. следующий раздел.) 


Единственными экранированными последовательностями в двойных кавычках, 
обрабатываемыми в этом качестве, являются именованные символы и семь по- 
следовательностей трансляции: \№МСНААМАМЕ}, \, \и, \1, \1, \Р, \0 и \Е. Если бы мы 
посмотрели, как устроен компилятор регулярных выражений Регі, то нашли бы 
в нем код для обработки таких экранированных последовательностей, как \ї для 
символа табуляции, \п для символа перевода строки и т. д. Но кода для обработки 
перечисленных выше экранированных последовательностей мы бы не нашли. 
(Мы перечислили их в табл. 5.9 только потому, что многие рассчитывают найти 
их там.) Если каким-то образом нам удастся протащить их в шаблон, не проведя 
сначала интерполяцию, они не будут распознаны. Если удастся протащить име- 
нованный символ, возникнет ошибка, потому что таблица символов, которая бы- 
ла активна при создании строки, должна использоваться и для преобразования 
имен символов в коды символов. (Это обусловленс тем, что Ре! позволяет созда- 
вать собственные, нестандартные псевдонимы имен символов, так что не всегда 
речь идет о стандартном наборе символов. См. раздел «сһагпатеѕ» в главе 29.) 


Как могут прокрасться такие символы? Например, через подавление интерполя- 
ции – путем использования одиночных кавычек в качестве ограничителя шабло- 
на. В" .’, дг... из’ ..’ одинарные кавычки подавляют интерполяцию пере- 
менных и обработку экранированных последовательностей, как если бы это были 
обычные строки, заключенные в одинарные кавычки. Если сказать п'\иѓгойо’, то 
бедняга Ёгодо (заглавными буквами) найден не будет. Однако, поскольку «обыч- 
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ные» символы с обратной косой чертой в любом случае не обрабатываются на 
этом уровне, п'\Е\4' все же соответствует действительному символу табуляции, за 
которым следует цифра. 


Другим способом преодоления интерполяции служит сама интерполяция. Если 
сказать: 


фуаг = '\0'; 
/${уаг} Егодо/; 


то несчастный Ёгодо останется в нижнем регистре. Рей не станет повторять про- 
ход интерполяции лишь потому, что вы интерполировали нечто, что, похоже, мо- 
жет быть повторно интерполировано. Нельзя рассчитывать, чтс это будет рабо- 
тать, так же, как и такая двойная интерполяция: 


фһоббії = “Егодо”; 
фуаг = "$һоббіЕ`; # (одинарные кавычки) 
/$маг/: # означает т'$ћобріт’, а не тм'’Егобо 


Вот еще пример, показывающий, что большинство обратных косых черт интер- 
претируется анализатором регулярных выражений, а не при интерполяции пере- 
менных. Представим себе, что есть простая программа в стиле вғер, написанная 
на Ре! :1 


в! /иѕг/біп/рег1 
фраїтегп = зп РЕ; 
мһіЛе (<>) ( 

ргіпі 1Е /фраттегп/; 
} 


Если назвать эту программу рёгер и вызвать ее так: 
% рогер "\\0 *.с 


мы обнаружим, что она выводит все строчки исходного кода на С, в которых за 
символом табуляции следует цифра. Нам не пришлось делать что-либо особен- 
ное, чтобы заставить Рег! понять, что \{ означает табуляцию. Будь шаблоны Рег 
просто интерполируемыми строками в двойных кавычках, нам бы пришлось; 
к счастью, они таковыми не являются. Они распознаются непосредственно ана- 
лизатором регулярных выражений. 


Настоящая программа дғер имеет ключ -., который отключает поиск с учетом ре- 
гистра. Этот ключ не нужно добавлять к нашей программе регер; она и без изме- 
нений умеет обрабатывать его. Достаточно передать ей несколько более замысло- 
ватый шаблон со встроенным модификатором /1: 


% рогер ‘(71)г1пд’ (оїВ*. род 


Эта команда найдет «Кіпе», «гіпе», «В ПМС» ит. д. Эта функция редко встречается 
в литеральных шаблонах, поскольку всегда можно просто написать ,'+10/і. Но 
для шаблонов, передаваемых в командной строке, в формах поиска в Интернете 
или встроенных в файлы конфигурации это, может стать настоящим спасатель- 
ным кругом. (Раз уж зашла речь о кольцах.) 


' Если раньше вы не знали, что за программа гер, то теперь узнаете. Ни одна система не 
обойдется без дтер: мы считаем Егер самой полезной программкой из когда-либо со- 
зданных. (Отсюда логически следует, что мы не считаем Рег] маленькой программой.) 
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Оператор цитирования регулярных выражений аг/РАТТЕКМ/ 


Переменные, интерполирующиеся в шаблоны, делают это на этапе выполнения, 
а не компиляции. В былые времена это замедляло выполнение программы, по- 
скольку Рей приходилось проверять, не изменил ли пользователь содержимое 
переменной; а если изменил, то перекомпилировать регулярное выражение. Сей- 
час же Ре: значительно поумнел, и, чтобы заметить выгоду от практически вы- 
мершего модификатора /о (он предписывает Ре! интерполировать переменные 
и компилировать шаблон лишь единожды), придется выполнять интерполяцию 
в шаблонах, длина которых составляет не менее 10000 символов: 


ргіп 16 /Фратегп/о; 


Хотя это прекрасно работает в нашей программе рагер, в общем случае это не ра- 
ботает. Предположим, у нас есть куча шаблонов, и мы собираемся выполнять со- 
поставление со всеми шаблонами в цикле, возможно, так: 


Ғог ту $1{ет (@дата) { 
Гог ту Фра (@раїтегпѕ) { 
ЇР (Фет =- /Фраф/) { } 


} 


Нельзя написать /$раї/о, поскольку значение $раї изменяется в каждой итерации 
внутреннего цикла. 


Решением является оператор дг/РАТТЕРМ/тз1хродиа1, который заключает в кавыч- 
ки и компилирует как регулярное выражение передаваемый ему шаблон РАТТЕАМ, 
а кроме того, по понятным причинам, на письме и в речи сокращается до дг//. 
РАТТЕВМ интерполируется таким же образом, как ь операторе п/РАТТЕЛМ/. Если в ка- 
честве ограничителя используется одинарная кавычка `', то интерполяция пере- 
менных (или семи экранированных последовательностей трансляции) не произ- 
водится. Оператор возвращает особое значение, которое можно использовать вме- 
сто эквивалентного литерала в соответствующем поиске по шаблону или подста- 
новке. Например, 


$гедех = дг/ту. ЅТАІМС/і5, 
3/$гедех/зотетн1та е1зе/; 


эквивалентно: 
$/ту. 5ТВІМС/ѕотеїћіпо е156/15 


Поэтому в приведенной выше задаче с вложенным циклом обработайте предвари- 
тельно свои шаблоны в отдельном цикле: 


@гедехез = (), 

Гог ту $раї (@раїіёегпѕ) { 
ризп @гедехез, дг/фраї/; 

} 


или разом с помощью оператора Рег] пар: 
@гедехез = тар { 9г/$_/ } @ра\егпз; 


А затем измените цикл, чтобы он использовал прекомпилированные регулярные 
выражения: 
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Рог ту $11ет (@дафа) { 
Гог ту $ге (@гедехез) { 
17 ($ітет =- /$ге/) { } 


} 


Теперь при сопоставлении Рей не придется компилировать регулярное выраже- 
ние в каждой проверке 1[, поскольку скомилированное регулярное выражение 
уже существует. 


Результат выполнения 4г// можно даже интерполировать в другой шаблон, как 
если бы этот оператор был простой строкой: 


$гедех = дг/$раїтегп/; 
$$1г119 =- /Р00$4{гедех}раг/; # интерполировать в более крупный шаблон 


На этот раз Ре! перекомпилирует шаблон, но всегда можно связать вместе не- 
сколько операторов ог//. 


Это работает, потому что оператор 09г// возвращает объект особого типа, в котором 
перегружена операция превращения в строку, как это описано в главе 18. Если 
вывести возвращаемое значение, то можно увидеть эквивалентную строку: 


изе \5. 14; 
$ге = дг/ту.51н1№6/15; 
зау $ге; # выведет (2^и$1:ту. ТВАІМ) в м5. 14 


Символ ^ указывает, что шаблон начинается с установки модификаторов по умол- 
чанию. Модификатор /и указывает, что действует прагма “ип1соде_$1г1п9$”, по- 
скольку выше сказано: изе \5.14. Модификаторы /ѕ и /1 включены в шаблоне, по- 
тому что мы передали их оператору 4г//. Модификаторы же /х и /п не упомянуты, 
потому что они уже отключены в стандартном окружении, на которое указывает 
стартовый символ ^. Этот символ сбрасывает установленные пользователем моди- 
фикаторы и предписывает начать со стандартного набора. 


Всякий раз, интерполируя в шаблон строки неизвестного происхождения, следу- 
ет быть готовым к обработке исключительных ситуаций, возбуждаемых компи- 
лятором регулярных выражений, если кто-то подбросит строку с дикими зве- 
рюшками: 


дг/Фраї/15; # может убежать и съесть вас 
ема1 { 9г/$рат/1з } || магп # попалась во внешнюю клетк 


$ге 
$ге 


В главе 27 вы узнаете больше об операторе еха1. 


Компилятор регулярных выражений 


После того как этап интерполяции переменных пройден, возможность разобрать- 
ся с шаблоном, наконец, предоставляется анализатору регулярных выражений. 
В этот момент неприятности нам практически не грозят, если мы не напутали 
в скобках и не использовали бессмысленные последовательности метасимволов. 
Анализатор осуществляет рекурсивно-нисходящий анализ регулярного выраже- 
ния, и если разбор произведен, оно превращается в формат, пригодный для ин- 
терпретации Механизмом (см. следующий раздел). Самое интересное в анализа- 
торе связано с оптимизацией регулярного выражения для максимально быстрого 
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его выполнения. Эту часть мы излагать не будем. Секрет фирмы. (Слухи о том, 
что, глядя на код обработки регулярных выражения, можно сойти с ума, сильно 
преувеличены. Как мы надеемся.) 


Зато можно полюбопытствовать, если вам угодно, что анализатор думает о вашем 
регулярном выражении. Если вежливо его об этом спросить, он ответит. Сказав 
изе ге “дебид", можно увидеть, как анализатор регулярных выражений обрабаты- 
вает шаблон. (Те же сведения можно получить при помощи ключа командной 
строки -0г, которым можно пользоваться, если Рег! собирали сфлагом -РрЕВООСІМС.) 


#1! /иѕг/юіп/рег1 
иѕе ге “дебид”; 
"Зтеа9о1” =- /^5т(. *)[ае100]1$/; 


Ниже следует вывод этой программы. Можно видеть, что перед выполнением 
Рег] компилирует регулярное выражение и назначает смысл компонентам шаб- 
лона: В0!1 означает начало строки (7), ВЕС_АМУ — точку, и так далее: 


Сотр111п9 ВЕх '^5т(. * )[аезои]1$ 
Ріпа1 ргодгат: 

1: ВО (2) 

2: ЕХАСТ <9м> (4) 

4: ОРЕМ (6) 

6: ЅТАВ (8) 

ТА ВЕС_АМУ (0) 

8: С10$Е1 (10) 

10: АМУОЕ[Гаелои]Ё] (21) 

21: ЕХАСТ <1> (23) 

23: ЕОЁ (24) 

24: ЕМ (0) 
апсһогед “5т” ат С ?1оатіпо “1"$ аї 3..2147483647 (сһескіпд апсһогеа) 
апсһогед(вог) тіпіеп 4 


Некоторые строки аннотируют заключения, сделанные оптимизатором регуляр- 
ных выражений. Ему известно, что строка должна начинаться с букв `5", и пото- 
му нет оснований для обычного просмотра слева направо. Ему известно, что стро- 
ка должна оканчиваться буквой `1, поэтому иные строки он без промедления 
отвергает. Ему известно, что строка должна быть не короче четырех символов, 
поэтому более короткую строку он игнорирует с лету. Ему также известно, какой 
символ самый редкий в каждой неизменяющейся строке, что иногда помогает 
при поиске в «изученных» строках. (См. зтиду в главе 27.) 


Затем производится трассировка выполнения сопоставления с шаблоном: 


биеѕѕіпд ѕТагі оғ мафси іп ѕу Рог ВЕх “^5п(. *)[аеіои ]1$° адазпзт “Зтеадо1” 
биеѕѕед. таїсһ аї оттзет 0 
Матсһіпо ВЕх "^5т(. *)[аеіои]1$"° адаіпѕі "Ѕтеадо1" 
0 <> <Ѕтеадо1> | 1:В01(2) 
0 <> <5теадо1> | 2:ЕХАСТ <5т>(4) 
2 <5т> <еадо1> | 4:0РЕМ(6) 
2 <$п> <еадо1> | 6: 5ТААС8» 
ВЕС АМҮ сап таїсһ 5 їітеѕ 
ОЕ ОЕ 2147483647... 
7 <8теадо1> <> | 8: С10$Е1(10) 
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7 <Ѕтеадо1> <> | 10: АМҮОЕ[аеіїоси 1 1021) 
Ғаі1еад 

6 <Зтеадо> <1> | 8: СІ05Е1(10) 

6 <Ѕтеадо> <1> | 10: АМҮОЕГаеїіои ][ 1021) 
Ғаі1еа. 


<Ѕтеад> <01> 
<Ѕпеад> <01> 


5 8: (10$Е1(10) 
5 

6 <Ѕтеадо> <1> 

7 

7 


10: АМУОЕ[ае1ои][](21) 
21: ЕХАСТ <1>(23) 

23: Е0І(24) 

24: ЕМ0(0) 


<Ѕтеадо1> <> 

<$теадо1> <> 
Маїсћ зиссезз Тит! 
Ғгееіпд ВЕх: “5 (. * )[ае104]1$ 


Если взглянуть на пробелы в слове Ѕпеадо1, то можно увидеть, как Механизм ре- 
гулярных выражений выполняет «перелет», чтобы дать возможность .* проявить 
максимальную жадность, а затем откатывается назад, пока не станет возмож- 
ным сопоставить оставшуюся часть шаблона. Но об этом в следующем разделе. 


Маленький Механизм, который /(не)? может/ 


А теперь мы хотим рассказать сказку о Маленьком Механизме Регулярных Вы- 
ражений. который говорит: «Думаю, что смогу. Думаю, что смогу. Думаю, что 
смогу». 


В этом разделе мы излагаем правила, которыми руководствуется механизм регу- 
лярных выражений в Ре! для поиска соответствия шаблону в строке. Механизм 
очень настойчив и трудолюбив. Он часто продолжает работу, когда нам уже ка- 
жется, что ему пора сдаться. Механизм не сдастся, пока не будет полностью уве: 
рен, что найти соответствие между шаблоном и строкой невозможно. Приведен- 
ные ниже Правила объясняют, как Механизм «думает, что сможет» как можно 
дольше, пока узнает наверняка, может он или нет. Сложность задачи для нашего 
Механизма в том, что она не решается просто грубой силой. Ему приходится вес- 
ти поиск в потенциально очень сложном пространстве вариантов, отслеживая 
при этом, что уже проверено, а что еще нет. 


Механизм использует для поиска соответствия недетерминированный конечный 
автомат (МЕА, попдефегт1т1$ Ис бпііе-ѕіате аоќотаќёоп, который не следует путать 
с МЕГ, недетерминированной футбольной лигой). Это означает, что Механизм за- 
поминает, что опробовал, а что – нет, и если что-то не клеится, возвращается 
и пробует что-то другое. Данный алгоритм известен как перебор с возвратом 
(басКкігасКкіпёе); вы уж простите, но этот термин, честно-пречестно, внедрили не 
мы. Механизм может перепробовать миллион подшаблонов в определенной точ- 
ке, затем бросить их все, вернуться назад к некоторому варианту в начале и снова 
перебрать миллион подшаблонов в другой точке. Механизм не слишком умен, 
просто настойчив и дотошен. Если вы достаточно предусмотрительны, то снабди- 
те Механизму эффективным шаблоном, который не позволит выполнить много 
ненужных возвратов. 


Когда кто-то бросает фразу типа «регулярные выражения выбирают самое левое, 
самое длинное соответствие», то имеет в виду, что Рег! обычно предпочитает са- 
мое левое соответствие самому длинному. Но Механизм не осознает, что он что-то 
«предпочитает», он вообще не думает, а просто потрошит шаблон. Его «предпоч- 
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тения» возникают как эмерджентное свойство совокупности множества не свя- 
занных между собой правил. Вот они:! 


Правило 1 


Механизм пытается найти соответствие в строке как можно левее, чтобы регу- 
лярное выражение в целом находило соответствие согласно Правилу 2. 


Механизм начинает работу с точки перед первым символом и пытается найти 
соответствие всему птаблону с этой точки. Весь шаблон соответствует тогда 
и только тогда, когда Механизм достигает конца шаблона раньше, чем конца 
строки. Если соответствие найдено, Механизм сразу прекращает работу; про- 
должать поиск «более удачного» соответствия он не станет, даже если строка 
может соответствовать, шаблону несколькими способами. 


Если Механизм не может найти соответствие шаблону, начиная с первой пози- 
ции строки, то признает временное поражение и перемещается к следующей 
позиции в строке, между первым и вторым символами, и снова испытывает 
все возможности. В случае успеха Механизм останавливается. В случае неуда- 
чи продолжает движение по строке. Поиск в целом не считается безуспеш- 
ным, пока не опробовано все регулярное выражение в каждой позиции стро- 
ки, в том числе за последним символом. 


В строке из п символов фактически имеется п + 1 позиция для поиска соответ- 
ствия. Дело в том, что начало и конец соотвегствия находятся между символа- 
ми строки. Это правило иногда удивляет тех, кто пишет шаблон типа /х*»/, кото- 
рый может соответствовать нулю или более символов "х". Если применить этот 
шаблон к строке "Ғох’, Механизм не найдет "х". Вместо этого он немедленно 
найдет соответствие нулевой строке перед "Г" и больше ничего искать не ста- 
нет. Чтобы найти один или более символов х, нужно использовать шаблон /х+/. 
О квантификаторах читайте в Правиле 5. 


Следствием этого правила является то, что каждый шаблон, соответствую- 
щий пустой строке, будет гарантированно соответствовать самой левой пози- 
ции в строке (при отсутствии противоречащих этому утверждений нулевой 
ширины). 

Правило 2 


Когда Механизм обнаруживает набор альтернатив (разделенных символами |) – 
на верхнем уровне, либо на текущем уровне группировки, — он опробует их 
слева направо, останавливаясь на первом успешном соответствии, позволяю- 
щем благополучно завершить поиск шаблона в целом. 


Набор альтернатив соответствует строке, если соответствует какая-либо из 
альтернатив согласно Правилу 3. Если ни одна из альтернатив не соответству- 
ет, происходит возврат к Правилу, вызвавшему данное Правило, которым 
обычно является Правило 1, но это может также быть Правило 4 или 6, если 
мы находимся внутри группы. Вызывающее правило ищет новую позицию, 
в которой можно применить Правило 2. 


Некоторые из этих вариантов могут быть пропущены, если оптимизатор регулярных 
выражений сказал свое слово, как если бы наш механизм проскочил сквозь гору с по- 
мощью квантового туннельного эффекта. Нс в данном изложении об оптимизаторе 
нужно забыть. 
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Если альтернатива только одна, то либо она соответствует, либо нет, и Прави- 
ло 2 по-прежнему действует. (Такой вещи, как пустая альтернатива, не суще- 
ствует, поскольку с пустой строкой всегда устанавливается соответствие.) 


Правило З 


Любая конкретная альтернатива соответствует строке, если все элементы, 
перечисленные в альтернативе, последовательно находятся в строке согласно 
Правилам 4 и 5 (так, чтобы при этом удовлетворялось регулярное выражение 
в целом). 

Элемент состоит из утверждених (о них говорится в Правиле 4) или кванти- 
фицированного атома (о них говорится в Правиле 5). Элементам, для которых 
есть несколько вариантов соответствия, обрабатываются строго слева напра- 
во. Если нельзя найти соответствие элементам в заданном порядке, Механизм 
выполняет возврат и выбирает следующую альтернативу согласно Правилу 2 


Элементы, которые должны быть последовательно найдены, не разделяются 
в регулярном выражении особыми конструкциями синтаксиса: они просто 
идут подряд в том порядке, в котором должны оказаться в строке. Когда мы 
просим найти /^Гоо/, то фактически просим найти четыре элемента, распола- 
гающиеся один за другим. Первый является утверждением нулевой ширины, 
отыскиваемым согласно Правилу 4, а остальные три представляют собой 
обычные символы, которые должны совпасть сами с собой, один за другим, 
согласно Правилу 5. 


Порядок слева направо означает, что в шаблоне: 
/х+у+/ 


сначала х» выбирает один способ соответствия, ғ. затем у* пробует все свои спо- 
собы. Если последнее завершается неудачей, то х* получает возможность вы- 
брать свой второй вариант и заставить у* снова перепробовать все свои спосо- 
бы, и т. д. Элементы, расположенные правее, «изменяются быстрее», если по- 
заимствовать выражение у многомерных массивов. 


Правило 4 


Если утверждение не обнаруживает соответствия в текущей позиции, Меха- 
низм возвращается к Правилу 3 и перебирает другие варианты для элементов 
более высокого приоритета- 


Некоторые утверждения более замысловаты, чем другие. В Рей много расши- 
рений регулярных выражений, и некоторые из них являются утверждениями 
нулевой ширины. Например, положительная опережающая проверка (?=. › 
и отрицательная опережающая проверка (?!. ) не соответствуют каким-либо 
символам, а просто утверждают, что регулярное выражение ... должно (или 
не должно) соответствовать в этой точке, если бы мы гипотетически попробо- 
вали его применить.! 


На деле Механизм действительно пытается найти соответствие. Механизм возвраща- 
ется к Правилу 2, чтобы проверить подшаблон, а затем стирает все упоминания о том, 
какая часть строки была «проглочена», и возвращает только результат сопоставле- 
ния – успех или неудачу. (Захваченные подстроки, однако, запоминаются.) 
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Правило 5 


Соответствие атому с квантификатором устанавливается в том случае, когда 
сам атом соответствует некоторое число раз, допускаемое квантификатором. 
(Соответствие самого атома устанавливается согласно Правилу 6.) 


Для разных квантификаторов требуется разное число соответствий, и боль- 
шинство квантификаторов допускает использование диапазона совпадений. 
Многократные соответствия должны идти подряд, т.е. примыкать друг к дру- 
гу в строке. Для неквантифицированного атома неявно предполагается нали- 
чие квантификатора, требующего ровно одного соответствия (иначе говоря, 
/х/ означает то же самое, что /х{1}/). Если в текущей позиции нельзя найти со- 
ответствие допустимому количеству экземпляров атома, Механизм возвраща- 
ется к Правилу 3 и перебирает другие варианты для элементов более высокого 
приоритета. 


Квантификаторами служат символы и сочетания *, +, ?, *7, +7, 77, ++, ++, 7+, атак- 
же различные виды фигурных скобок. Если используется формат {СОИМТ}, то 
выбора нет, и атом должен соответствовать ровнс СОИМТ раз. В противном слу- 
чае для числа соответствий атома имеется некоторый диапазон, и Механизм 
отслеживает все выбираемые варианты, чтобы при необходимости осущест- 
вить возврат. Но при этом возникает вопрос, с которого из вариантов следует 
начать. Можно начать с максимального числа и затем снижать его, а можно — 
с минимального и увеличивать его. 


Обычные квантификаторы (без вопросительного знака в конце) предписыва- 
ют жадный поиск; это значит, что они пытаются найти как можно более длин- 
ное соответствие. Чтобы найти самое длинное соответствие, Механизму при- 
ходится проявлять некоторую осторожность. Неверное предположение может 
обойтись очень дорого, поэтому на практике Механизм не производит обрат- 
ный отсчет от самого большого значения, которое может быть Очень Большим 
и повлечь миллионы неправильных предположений. Поэтому Механизм по: 
ступает несколько умнее: сначала он подсчитывает, сколько соответствую- 
щих атомов (подряд) в действительности имеется в строке, а затем использует 
этот фактический максимум в качестве первого выбранного значения. (Он 
также запоминает все более короткие варианты на случай, когда самый длин- 
ный не вписывается.) Затем он (наконец-то) пытается найти соответствие для 
оставшейся части шаблона, предполагая, что самый длинный вариант явля- 
ется самым лучшим. Если для самого длинного варианта оказывается невоз- 
можно найти соответствие с оставшейся частью шаблона, происходит возврат 
и опробуется следующий по длине вариант. 


Если, например, мы говорим /.*Гоо/, то Механизм пытается найти максималь- 
ное число «любых» символов (представленных точкой) вплоть до конца стро- 
ки, прежде чем пытаться найти "100"; и когда для "Гоо" там не находится соот- 
ветствия (и не может найтись, потому что в конце строки для него недостаточ- 
но места), Механизм начинает «сдавать» по одному символу с конца, пока не 
найдет "Гоо". Если "Роо” встречается в строке более одного раза, механизм оста- 
новится на последнем вхождении, поскольку в действительности это будет 
первое найденное при поиске с возвратом соответствие. Когда найден весь шаб- 
лон при некоторой определенной длине .*, Механизм знает, что может теперь 
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отбросить все более короткие варианты для .» (те, которые она стала бы ис- 
пользовать, если бы текущее “Гоо” не подошло). 


Завершая жадный квантификатор вопросительным знаком, мы превращаем 
его в умеренный квантификатор, который для первой попытки выбирает са- 
мое маленькое количество соответствий. Поэтому, если сказать /.*?Т00/, то .*? 
сначала пытается найти соответствие 0 символов, затем 1 символу, затем 2 
и так далее, пока не будет найдено соответствие “Гоо”. Вместо того чтобы отсту- 
пать назад, Механизм, так сказать, отступает вперед и заканчивает работу, 
найдя в строке первое вхождение "Тоо", а не последнее. 


Правило 6 


Поиск каждого атома производится на основе семантики его типа. Если соот - 
ветствие атому не найдено (или найденное не позволяет успешно сопоставить 
оставшуюся часть шаблона), Механизм откатывается к Правилу 5 и опробует 
другой вариант количества экземпляров атома. 


Соответствие атомов определяется согласно следующим типам. 


» Регулярное выражение в круглых скобках, (...), соответствует тому же, че- 
му соответствует регулярное выражение (представленное ...) согласно Пра- 
вилу 2. Скобки действуют, как оператор группировки для квантифициро- 
вания. Скобки имеют также побочный эффект, сохраняя найденную под- 
строку, которую можно потом использовать в ссылке на группу (часто назы: 
ваемой обратной ссылкой). Побочный эффект можно подавить расширением 
конструкции (?:...), которая имеет только группирующую семантику: она 
ничего не запоминает в $1, $2 и других переменных. Возможны и другие 
формы атомов (и утверждений) в скобках – см. оставшийся материал этой 
главы. 


• Точка соответствует любому символу, за исключением, возможно, символа 
перевода строки. 


• Список символов в квадратных скобках (класс символов) соответствует лю- 
бому из символов, указанных в списке. 


• Буква, предваренная обратной косой чертой, соответствует конкретному 
символу или символу из числа приведенных в табл. 5.9. 


» Любой другой символ, предваренный обратной косой чертой, соответству- 
ет этому символу. 


• Любой символ, не упомянутый выше, соответствует самому себе. 


Все это звучит довольно сложно, но ведем мы к следующему. Для каждого набора 
вариантов, созданного квантификатором или перечислением, у Механизма регу- 
лярных выражений есть ручка, которую можнс покрутить. Он будет крутить эти 
ручки, пока не найдется соответствие шаблону в целом. Правила просто говорят, 
в каком порядке механизму регулярных выражений позволено крутить эти руч- 
ки. Слова «механизм регулярных выражений предпочитает самое левое соответ- 
ствие» просто означают, что ручку начальной позиции он крутит медленнее все- 
го. А поиск с возвратом означает, что нужно открутить назад ручку, которую мы 
только что крутили, и попытаться покрутить ручку, находящуюся выше в поряд- 
ке старшинства, положение которой изменяется медленнее. 


Вот более конкретный пример — программа, которая для пары смежных слов об- 
наруживает соответствие окончания одного слова началу другого: 
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$а = ‘пободу`, 

$0 = `бодуѕпаїсћег '; 

іҒ ("Фа $6” =- /7(\м+) (\и+) \2(\и+)$/) { 
ргіпЕ "$2 перекрывается в $1-$2-$3\п" 

} 


Программа выведет: 
роду перекрывается в по-боду-зпатспег 


Можно предположить, что $1 из-за своей жадности сначала захватит все слово 
"породу". Так и происходит — поначалу. Но когда это сделано, не остается символов 
для переменной $2, которые необходимо поместить в нее из-за квантификатора +. 
Поэтому механизм регулярных выражений отступает, и $1 неохотно отдает один 
символ для $2. На этот раз успешно отыскивается пробел, но затем механизм ви- 
дит \2, которая представляет жалкую букву у. Следующий символ в строке не у, 
а 0. Механизму приходится постоянно отступать и делать еще попытки, и, в ко- 
нечном итоге, $1 отдает слово «оу» переменной $2. НаБеаз согриз„! так сказать. 


На самом деле, это не вполне срабатывает, когда само перекрытие является удвое- 
нием, как, например, в паре слов “гососо” и "сосооп". Приведенный выше алго- 
ритм решит, что перекрывающейся строкой, $2, будет "со", а не "сосо". Но нам не 
нужно "госососооп"; нам нужно "гососооп". Это тот случай, когда вы можете ока- 
заться умнее Механизма. Добавив квантификатор минимального соответствия 
к части $1, получим превосходный шаблон /^(\м+?)(\м+) \2(\м+)$/, который делает 
как раз то, что нужно. 


Значительно более подробное обсуждение достоинств и недостатков различных 
типов механизмов регулярных выражений можно найти в книге Джеффри Фрид- 
ла (ЗеЁ#геу Емей!) «Маѕіегіпе гебу]аг ехргеѕѕіопѕ».? Механизм регулярных выра- 
жений Рег] очень хорошо выполняет многие повседневные задачи, которые требу- 
ется выполнять с помощью Рен, и успешно решает даже не вполне повседневные, 
если проявить к нему чуточку уважения и понимания. 
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Опережающие и ретроспективные проверки 


Иногда требуется только глянуть украдкой. Существует четыре расптирения ре- 
гулярных выражений, которые позволяют сделать это и которые мы называем 
проверками обстановки (Іоокагоипа аѕѕегііопз). поскольку они позволяют выпол- 
нить своего рода разведку, не осуществляя настоящий поиск символов. Эти про- 
верки позволяют выявить соответствие некоторому шаблону, которое было бы 
(или не было бы) найдено. если бы мы попытались это сделать. Механизм решает 


Акт «НаБеаз Согриз», гарантирующий свободу личности, принятый в Англии в 1679 г., 
согласно которому судебная власть обязана по требованию заинтересованных лиц обес- 
печить доставку в суд всякого, кто подвергся заключению, для проверки законности 
ареста. – Прим. ред. 


Джеффри Фридл «Регулярные выражения», 8-е издание. — Пер. с англ. — СПб.: Сим- 
вол-Плюс, 2008. 
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задачу, осуществляя действительный поиск соответствия гипотетическому шаб- 
лону и делая потом вид, что оно не найдено (если найдено). 


Когда Механизм заглядывает вперед из текущей позиции строки, мы называем 
это опережающей проверкой (Іоокаћеай аззегНоп). Если он оглядывается назад — 
ретроспективной проверкой (ІоокБеһіпа аззегноп). Шаблоны для опережающей 
проверки могут быть любыми регулярными выражениями, но шаблоны для рет- 
роспективной проверки могут иметь только фиксированную ширину, поскольку 
Механизму требуется знать, откуда начинать сопоставление. 


Хотя все эти четыре расширения являются утверждениями нулевой ширины 
и потому не поглощают символы (по крайней мере, официально), они позволяют 
захватывать строки — достаточно добавить дополнительные уровни сохраняю- 
щих скобок. 


(?=РАТТЕНМ) (положительная опережающая проверка) 


Когда Механизм встречает конструкцию(?=РАТТЕВ№), он заглядывает дальше 
в строку и проверяет наличие соответствия шаблону РАТТЕНМ. Если вы помните, 
в нашей программе для удаления повторяющихся слов пришлось написать 
цикл, поскольку шаблон каждый раз съедал слишком много: 


$ = "Рагіѕ іп ТНЕ ТНЕ ТНЕ ТНЕ $рг1п9.”; 


# удалить слова, повторяющиеся дваждь (и трижды (и четырежды. ..)) 


1 мһі1е 5/\Ы(\м+) \1\6/$1/01; 


Услышав слова «съел слишком много», всегда нужно подумать об опережаю- 
щей проверке. (Ну, почти всегда.) Заглядывая вперед, вместо того, чтобы про- 
глотить второе слово, можно написать программу, удаляющую дубликаты за 
один проход, например: 


$/ \6(\и+) \з (7= \1\0 ) //9х2; 


Конечно, это не совсем правильный код, поскольку он может исказить и кор- 
ректные фразы вроде «Тре сіоёћеѕ уои ОМ РОМ№ бі». 


Опережающие проверки можно использовать для реализации перекрываю- 
щихся соответствий. Например. 


"0123456789" =- /(\9{3})/д 


вернет всего три строки: 012, 345 и 678. Обернув сохраняющую группу опере- 
жающей проверкой: 


"0123456789" =- /(?=(\9{3}))/9 


можно получить все перекрывающиеся соответствия: 012, 123, 234, 345, 456, 567, 
678 и 789. Действие данного фрагмента кода основано на том, что утверждение 
заглядывает вперед, чтобы отыскать и сохранить соответствие, но, будучи 
опережающей проверкой, не поглощает ни одного символа. Когда Механизм 
обнаруживает, что должен повторить попытку из-за использования модифи- 
катора /0, то перешагивает через один символ. 


(?!РАТТЕРМ№) (отрицательная опережающая проверка) 


Когда Механизм встречает конструкцию (?!РАТТЕНМ;, он заглядывает дальше 
в строку и проверяет отсутствие соответствия шаблону РАТТЕВМ. Чтобы испра- 
вить предшествующий пример, можно добавить отрицательную опережающую 
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проверку вслед за положительной опережающей проверкой и исключить слу- 
чай сокращенной формы: 


8/ \6(\и+) \з (2= \Л\Ь (91 `\м))//хот; 


Метасимвол \м в конце необходим, чтобы можно было различать сокращение 
и слово в конце предложения в одинарных кавычках. Можно пойти еще даль- 
ше, чтобы законные обороты, такие как «ав іћаї рагіісшаг», наша програм- 
ма не «исправляла». Мы добавим альтернативу для отрицательной опережаю- 
щей проверки, чтобы предотвратить исправление «ах» (и таким образом по- 
кажем, что для группировки альтернатив может использоваться любая пара 
круглых скобок): 


5/ \6(\м+) \5 (2= \Т\Ь (7! °\м | \$ рагтісиаг))//9іх 


Теперь мы знаем, что фраза «Њћаї {Ва рагіісшаг» в безопасности. К несчастью, 
Геттисбергская речь' по-прежнему под угрозой. Поэтому добавим еще одно ис- 
ключение: 


5/ \Ы(\м+) \з (?= \1\6 (7! "\м | \$ рагїісшаг | \ѕ паїіоп))//19х; 


Это уже начинает выходить из-под контроля. Поэтому составим Официаль- 
ный Список Исключений и прибегнем к хитрому трюку с интерполяцией, что- 
бы переменная $" разделяла альтернативы символом |: 


©гһатЕћаї = одм(рагіісџ1аг паїјіоп); 
Іоса1 $" = |’; 
5/ М(\м+) \з (3= \1\0 (21 '\м | \5 (7: Өсһаїһаї )))//хід; 


{?<=РАТТЕВМ) (положительная ретроспективная проверка) 


Когда Механизм обнаруживает конструкцию (7<=РАТТЕВМ), он «оглядывается» 
в строке и проверяет наличие соответствия шаблону РАГТЕВМ. 


В нашем примере все еще остается проблема. Хотя он уже позволяет Честному 
Эйбу произносить такие фразы, как «Њаё Њаё паНоп», он также допускает 
фразы типа «Рагіѕ, іп {Ре һе пайоп оѓ Егапсе». Мы можем добавить положи- 
тельную ретроспективную проверку перед нашим списком исключений, что- 
бы гарантировать применение исключений бїћаїїпаї только к «фр а$ һа» 


/ \о(\м) \$ (?= \140 (7! °\м | (2<= һат) \$ (7: @їһаїтћаї )))//1хд; 


Да, это становится ужасно сложным, но потому этот раздел и назван «Замы- 
словатые шаблоны», в конце концов. Если вам потребуется сделать шаблон 
еще более замысловатым, чем к данному моменту сделали мы, разумное при- 
менение комментариев и 0г// поможет вам сохранить здравомыслие. Или, по 
крайней мере, сохранить большую его часть. 


Или подумайте об использовании метасимвола \К, чтобы обмануть Механизм 
относительно того, где официально начинается соответствие. В этом случае пре- 
дыдущий шаблон будет действовать как своего рода ретроспективная проверка 
для официальной части шаблона, но сканирование текста будет выполняться 
слева направо. Это особенно удобно, когда возникает потребность изменять 


Речь Авраама Линкольна, произнесенная в 1863 году и считающаяся образцом оратор- 
ского искусства. Содержит оборот «Вай {Ва паНоп» — «чтобы эта нация». – Прим. пе- 
рев. 
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глубину ретроспективной проверки, чего невозможно добиться другими сред- 
ствами Механизма. 


(7<!РАТТЕВМ) (отрицательная ретроспективная проверка) 


Обнаружив конструкцию (?<!=РАТТЕА№М), механизм «оглядывается» назад в стро- 
ке и проверяет отсутствие соответствия шаблону РАТТЕВМ. 


На этот раз возьмем совсем простой пример. Простой вариант старого орфо- 
графического правила: «І перед Е, если только не после С». На Ре! ошибки 
исправляются так: 


$/(?<!с)е1/1е/в 


Программист должен сам решить для себя, будет ли он обрабатывать какие- 
либо исключения. (Например, «мег» пишется как «у’егд», а произносится 
как «үіега».) 


Неуступающие группы 


Как описывалось в разделе «Маленький Механизм, который /(не)? может/», при 
сопоставлении с шаблоном механизм регулярных выражений часто осуществляет 
перебор с возвратом. Можно помешать механизму регулярных выражений осуще- 
ствлять возврат к некоторому набору вариантов при помощи неуступающей груп 
пировки. Неуступающая группировка (?>РАТТЕЛМ) работает так же, как простая 
группировка (?:РАТТЕЙМ), но, если она обнаруживает соответствие шаблону РАТТЕНМ, 
возврат к другим квантификаторам или альтернативам внутри подшаблона по- 
давляется. (Следовательно, бессмысленно использовать такой подход с шаблоном, 
не содержащим квантификаторов или альтернатив.) Единственный способ заста- 
вить Механизм изменить свое решение — это выполнить возврат к чему-либо до 
подшаблона в невозвращающей группе и повторно войти в подшаблон слева. 


Это похоже на посещение авгодилера. Всласть наторговавшись, вы ставите уль- 
тиматум: «Вот мое последнее предложение; либо оно принимается, либо мы рас- 
ходимся». Если оно не принимается, вы не начинаете снова торговаться. Вместо 
этого вы возвращаетесь восвояси — через входную дверь. Можно пойти к другому 
дилеру и опять начать торговаться. Вам позволено снова торговаться, но только 
потому, что вы снова вошли в неуступающую группу в другом контексте. 


Приверженцы языков Ргоюй и 5МОВОІ, могут представить это себе как ограни- 
чивающий возвраты оператор отсечения (ѕсореа си) и, соответственно, оператор 
«забора» ({епсе орегафог). 


Посмотрите, как в “аааб” =- /(?:ах)аб/ подшаблон а* сначала находит три а, а по- 
том отдает одну из них, поскольку последняя буква а понадобится позже. Под- 
группа жертвует частью того, что ей требуется, чтобы успешным оказалось со- 
поставление в целом. (Продолжая нашу аналогию — вы разрешаете продавцу ав- 
томобиля уговорить вас на бблышую цену, поскольку боитесь, что иначе сделка не 
состоится вовсе.) Напротив, подшаблон в “аааб” =- /(?>а»)ар/ никогда не отдаст 
того, что захватил, даже если такое его поведение приведет к невозможности со- 
поставления в целом. (Как поется в песне, ты должен понимать, когда отвечать, 
когда пасовать, а когда из-за стола вставать.) 


Хотя группировка (?>РАТТЕРМ) полезна для изменения поведения шаблона, она 
применяется в основном, чтобы ускорить получение неудачного результата при 
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некоторых видах поиска, когда известно, что он все равно окажется неудачным 
(если только не будет успешным сразу). Механизму может потребоваться на удив- 
ление много времени, чтобы осознать бесперспективность поиска, особенно когда 
речь о вложенных квантификаторах. Следующий шаблон почти мгновенно при- 
водит к успеху: 


$_ = "ааааааааааааааааааааааааааааааааааааааааааааааааааааааааааааааааь"; 
/аза»а+а»а*а*а»*а«а+а*а+а»а*а+а»*аза*а+а*а*а«а*а«аза»жа*а*а*а+а*а»а*[ВО]/; 


Но проблема не в успехе. Проблема в неудаче. Если удалить из строки последнюю 
букву Б, то сопоставление с шаблоном, возможно, будет выполняться долгие и дол- 
гие годы, прежде чем будет завершиться с отрицательным результатом. Многие 
и многие тысячелетия. Фактически миллиарды и миллиарды лет! Внимательно 
посмотрев, мы обнаружим, что этот шаблон не может быть успешно сопоставлен, 
если в конце строки нет буквы 0, однако оптимизатор регулярных выражений не 
настолько сообразителен (на момент написания книги), чтобы определить, что 
ЛВ0]/ никогда не найдется. Но если дать ему намек, то можно заставить его быстро 
определить неудачу, в то же время позволяя получить успех, когда это возможно: 


/(?>а*ағ*ака*аха*а*а*а*а*а*а*ағағағахағахаха*ағағағағакакакакахаха*а*)[В0]/; 


Возьмем более реалистичный, как мы надеемся, пример. Представим себе про- 
грамму, которая считывает текст по абзацу за раз и показывает строки, имеющие 
продолжение – строки, отмеченные обратной косой чертой в конце строки. Вот 
образец из Маке{Ие для Рей, в котором действует данное соглашение по продол- 
жению строк: 


# Е11ез їо Бе биі1ї міїћ уагіаб1е зибзЕ1и оп беҒоге тіпірег1 

# 15 ауаі1аб1е. 

$Н = Макеғі1е Н сҒ2адѕ ЗН соп?ід һ.5Н такеарег1.5Н такедерепа. 5Н х 
такедіг. 5Н тусоп?ід. Н мгітетаіп. Н 


Можно написать такую простую программу: 


н! /иѕг/біп/реғг1 -00р 

иѕе Ѓеаїџге “зау“; 

мһіЈе ( /( (.+) ( (7<=\) \п =» )+ ) Хх) { 
ѕау “бОТ $. $1\п”- 

} 


Она работает правильно, но очень медленно. Дело в том, что Механизм отступает 
от конца строки с шагом в один символ, сокращая то, что находится в $1. Это не- 
умно. Если избавиться от ненужных захватов, это не сильно поможет. Шаблон: 


(.+(2:(2<=\\)\п. +)+) 


несколько ускоряет работу, но незначительно. В такой ситуации существенно по- 
могает неуступающая группировка. Шаблон: 


((9>.+) (3: (2<=\\)\п. *)+) 


В реальности речь, скорее, о многих септиллионах лет. Мы не можем сказать точно, 
сколько времени потребуется. Мы не стали дожидаться завершения работы в надежде 
на положительный результат. В любом случае, компьютер откажет раньше, чем слу- 
чится тепловая смерть Вселенной, а это регулярное выражение закончит свою работу 
позже, чем произойдет любое из этих событий. 
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делает то же самое, но на порядок быстрее, поскольку не тратит время на возврат 
в поисках того, чего нет. 


С помощью (?>...) нельзя добиться такого успеха, которого нельзя добиться с по- 
мощью (?:...) и даже простого (...). Но если провал неизбежен, лучше пусть он 
произойдет скорее, чтобы можно было жить дальше. 


Между прочим, поскольку наш пример содержит единственный квантификатор, 
группировку (?>.+) можно было бы записать более кратко, как .++. 


Программные шаблоны 


Большинство программ на Рен следует императивному (называемому также про- 
цедурным) стилю программирования, в котором набор отдельных команд подает- 
ся в понятном порядке: «Разогреть плиту, перемешать, глазировать, нагреть, ос- 
тудить, подать пришельцам.» Иногда в эту смесь добавляют чуть-чуть функцио- 
нального программирования («Возьмите немного больше глазури, чем, как вам 
кажется, нужно, даже после прочтения этого пункта инструкции, рекурсивно») 
или сдабривают ее объектно-ориентированной технологией (‹но, пожалуйста, 
придержите объекты анчоусов»). Часто встречается комбинация всех этих стилей. 


Но Механизм регулярных выражений применяет для решения задач совершенно 
иной подход, являющийся скорее декларативным. Мы описываем цели на языке 
регулярных выражений, а Механизм реализует ту логику, которая требуется для 
решения наших задач. Языки логического программирования (например, Рго]о5) 
не всегда освещаются так же хорошо, как языки, где доминируют остальные три 
стиля, но используются чаще, чем это может показаться. Рег] нельзя было бы да- 
же скомпилировать без таЁе(1) или уасс(1), которые можно рассматривать если 
не как чисто декларативные языки, то, по крайней мере, как гибриды, в которых 
соединились императивное и логическое программирование. 


В Рег! тоже можно поступать подобным образом, смешивая декларации целей 
с императивным кодом более смело, чем мы это делали до сих пор, и опираясь на 
сильные стороны обоих подходов. Можно программным образом создавать стро- 
ку, которая, в конечном счете, попадет на вход Механизма, в известном смысле 
создавая программу, которая пишет новую программу «на лету». 


Обычные выражения на Ре! можно также передавать в качестве заменяющей 
части оператора 5/// с помощью модификатора /е. Это позволяет динамически ге- 
нерировать строку замены путем выполнения фрагмента кода при обнаружении 
каждого соответствия шаблону. 


Еще более изощренным приемом является внедрение в любые точки шаблона 
фрагментов кода с помощью расширения (?{С00Е}). Такой фрагмент будет выпол- 
няться каждый раз, когда Механизм сталкивается с ним, перемещаясь по шабло- 
ну вперед и назад в сложном танце сопоставления с возвратами. 


Наконец, можно применить $///ее или (??{С00Е}) для введения еще одного уровня 
косвенности: сами результаты выполнения этих фрагментов кода будут повторно 
вычисляться и использоваться, создавая фрагменты программы и шаблона на ле- 
ту в нужный момент. 
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Генерируемые шаблоны 


Программы, пишущие другие программы, – самые счастливые программы на све- 
те.»! В книге Джеффри Фридла «Мазфегтя гесшаг ехргеѕѕіопѕ» окончательная де- 
монстрация силы заключается в написании программы, создающей регулярное 
выражение для определения того, удовлетворяет ли строка требованиям ВЕС 822, 
т.е. содержится ли в строке совместимый со стандартами допустимый почтовый 
заголовок. Шаблон на выходе этой программы имеет длину в несколько тысяч 
символов, и читать его примерно так же легко, как двоичный дамп памяти, созда- 
ваемый при аварийном завершении программы. Однако Механизм Рег! такими ве- 
щами не смутить; компиляция шаблона происходит «без сучка, без задоринки» и, 
что еще более интересно, поиск выполняется очень быстро – значительно быстрее, 
чем для многих коротких шаблонов, требующих сложного поиска с возвратами. 


Это очень сложный пример. А выше мы привели очень простой пример того же 
подхода, когда построили шаблон $пипрег из деталей (см. раздел «Интерполяция 
переменных»). Но чтобы продемонстрировать мощь этого программного подхода 
при создании шаблона, возьмем задачу средней сложности. 


Допустим, что необходимо выбрать все слова с определенной последовательностью 
гласных и согласных; например, «аи 410» и «еее» удовлетворяют шаблону УУСУУ 
(ГГСГГ):. Хотя нетрудно описать, что считать гласной, а что согласной, вряд ли вам 
захочется каждый раз заново набирать это на клавиатуре. Даже в нашем простом 
случае (УУСУУ) потребуется набрать шаблон, который выглядит примерно так: 


^[аезоцу [аелоцу Г соағопук1тпрагэїумхгу][ае1оиу][ае1оиу]$ 


Более универсальная программа должна получить строку УУСУ и программно 
создать такой шаблон. Еще лучше, если она сможет принять слово вроде аџіо, 
использовать его как макет для получения строки УСУ, а из нее уже получить 
требуемый шаблон. Кажется сложным, но на практике это не так, поскольку 
шаблон будет генерировать программа, такая как программа сотар ниже: 


#1 /иѕг/біп/рег1 

изе м5. 14; 

изе Ғеаїиге “зау”: 

ие магпіпо$; 

ту $\0ме1$ = ‘аезоцу’; 

ту $соп$ = "срағоһј Кипраг$Тмихху °; 

ту %тар = (С => $сопз, \ => $уоме15); # исходное отображение для С (С) и У (Г) 


Тог ту $с1аѕѕ ($\0ме1з, $сопѕ) { # теперь для каждого типа букв 

Рог (5р1ії //, $с1аз$) { # получить все буквы этого типа 

$тар{$_} = $с1аз$, # и отобразить букву обратно в тип 

} 
} 
ту $рат = ^"; 
Тог ту Фспаг (зр11е //, эћіғі) { # для каждой буквы в слове шаблона 

$раї .= "[%тар{Фсһаг} ]"; # добавить соответствующий класс символа 


Эндрю Юмом (Апагем Ните), известный философ ОМІХ. 


У - первая буква слова «уо\’е» (гласная), а С – слова «сопѕопапі» (согласная). — Прим. 
ред. 
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} 


пу $ге = 4г/7${ра+}%/1; # компилировать шаблон 

зау “ВЕСЕХ 1$ $ге”; отладочная выдача 

@ААСУ = (`/изг/зпаге/91ст/могаз °) # выбрать словарь по умолчанию 
Р -Е &8 !@АНСУ; 


Е: 


мне (<>) { # пройти через входные данные, 
ргіп 1 /фге/; # выводя все соответствующие строки 


} 


Все интересное содержится в переменной пар. Ключами этого хеша служат бук- 
вы алфавита, а соответствующими значениями - все буквы их типа. Си У тоже 
есть в ней, поэтому можно задать либо \У\С\\, либо аџдіо, и в любом случае полу- 
чить еег1е. Каждый символ аргумента, переданного программе, используется 
для извлечения нужного класса символов и добавления его в шаблон. Когда шаб- 
лон создан и скомпилирован с помощью дг//, сопоставление (даже для длинного 
шаблона) происходит быстро. Вот что можно получить, если запустить эту про- 
грамму с аргументом ѓогіџіїоиѕ1у (случайно, неожиданно): 


% сутар Ғогіиітоиѕ1у /иѕг/діст/могаѕ 

ВЕбЕХ 1$ (2701: "[сбдғоһјк1тпрагѕїумхгу ][аеіоиу](<рағоһјкітпрагеїмм 
хғу}[сбағоһјкітпроагѕёумхгу]1 ае1оцу [ае1оцу Г сбатоһу кітпрагѕтумхгу][а 
еіоџиу][аеіоиу Н сбатоһј кітпрог ѕумхгу 1[сбаѓоћј к1тпрагэтумхгу 1[аеіоиус 
рағоһј кітпрагѕіумхгу ]$) 

саггіадеар1е 

сігсиітоиѕ1у 

Ғогиітоиѕ1у 

1апдиогоџиѕ1у 

таггіадеаб1е 

ті1дџеТоаѕїѕ 

ъеъчиічиаг а 

ѕеѕаи1аи1па 

у111аіпоиѕ1у 


Глядя на это регулярное выражение, можно убедиться в том, какого объема гнус- 
ного ввода с клавиатуры удалось избежать благодаря «ленивому» программиро- 
ванию, хотя и окольным путем. 


Вычисления при подстановке 


Когда модификатор /е («е» от «ехргеѕѕіоп еуајиаёіоп» – вычисление выражения) 
используется в выражении $/РАТТЕЯЛ/СОрЕ/е, заменяющая часть интерпретирует- 
ся не как строка в двойных кавычках, а как выражение на языке Рег. Это похо- 
же на встроенную команду йо { С00Е }. Несмотря на внешний вид строки это, 
в действительности, блок кода, компилируемый одновременно с остальной про- 
граммой - задолго до того, как фактически будет производиться подстановка. 


Модификатор /е позволяет создавать строки замены более изощренным способом, 
чем интерполяция в двойных кавычках. Разницу можно показать на примере: 


$/(\9+)/$1 » 2/; # Заменяет"42” на "42 * 2” 
3/(\4+)/$1 * 2/е; # Заменяет “42” на "84" 


А вот как температура по Цельсию переводится в температуру по шкале Фарен- 
гейта: 
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$ = "Разогреть духовку до 233С. \п” 
в/\о(\а+\. ?\а* )С\Ь/1пЕ ($1 * 1.8 + 32) “Р”/е; в преобразование в 451Е 


Этому приему можно придумать бесконечное число применений. Вот фильтр, ко- 
торый модифицирует поступающие в него файлы по месту (как редактор), добав- 
ляя 100 к каждому числу, которым начинается строчка (и за которым следует 
двоеточие, на которое мы только смотрим, но не ищем или заменяем): 


Х рег] -рі -е ‘3/^(\9+)(7=:)/100 + $1/е’ Ғі1епапе 


Иногда нужно сделать несколько больше, чем просто использовать найденную 
строку в другом вычислении. Иногда нужно, чтобы строка и была вычислением, 
результат которого выступит в качестве заменяющего значения. Каждый допол- 
нительный модификатор /е вслед за первым заключает код, который нужно вы- 
полнить, в е\а1. Следующие две строки эквивалентны, но первую легче прочесть: 


$/РАТТЕВМ/СОРЕ/ее 
5/РАТТЕВМ/ема1 (СОБЕ)/е 


Этот прием подходит для замены упоминаний простых скалярных переменных 
на их значения; 


5/(\\м+) /$1/еед; # Интерполяция большинства значений скаляров 


Поскольку в действительности используется е\а1, модификатор /ее находит даже 
лексические переменные. Вот этот, слегка более развитой пример вычисляет за- 
мену для простых арифметических выражений с (неотрицательными) целыми 
числами: 


ф = "І пауе 4 + 19 ао11агѕ апа 8/2 септз.\п” 
$4 ( 
\а+ \3* й найти целое число 
[+*/-1 # и арифметический оператор 
\$* \0+ # и второе целое число 
) 
}{ $1 }еедх; # загем разьменовать $1 и выполнить этот код 
ргіпї; # "Г паме 23 до11агѕ апо 4 сепф$®. 


Как и для любых других вхождений еуа1 5ТАТМб, перехватываются ошибки этапа 
компиляции (например, синтаксические) и исключительные ситуации этапё. вы- 
полнения (например, деление на ноль). Если они возникают, то узнать, что про- 
изошло, можно из переменной $9 ($Е\А! _ЕВВОВ). 


Выполнение кода на этапе сопоставления 


В большинстве программ, использующих регулярные выражения, логической 
последовательностью выполняемых команд руководит управляющая структура 
этапа выполнения самой программы. Мы пишем условные инструкции Ш или 
циклы ине, либо вызываем функции или методы, которые могут привести к вы- 
зову операции сопоставления с шаблоном. Даже в $///е управление принадлежит 
оператору подстановки, а код, находящийся в строке замены, выполняется толь- 
ко при успехе поиска. 


В случае применения подшаблонов, содержащих код, обычная связь между регу- 
лярным выражением и программным кодом инвертируется. Когда Механизм 
применяет к нашему шаблону свои Правила на этапе поиска, он может наткнуть- 
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ся на расширение регулярного выражения вида (?{С00Е}). При срабатывании этот 
подшаблон не выполняет сопоставление или «заглядывание». Это утверждение 
нулевой ширины, которое всегда «успешно» и выполняется только для получе- 
ния побочных эффектов. Когда в процессе сопоставления с шаблоном Механизму 
нужно пройти подшаблон, содержащий код, он выполняет этот код. 


"91урһ" =- /.+ (?{ зау “һі” }) ./х; # Выведет “|1” два раза. 


Когда Механизм пытается сопоставить строку 01урћ с этим шаблоном, он сначала 
позволяет .+ «съесть» все пять букв. Затем выводит 11. Когда Механизм находит 
последнюю точку, все пять букв уже «съедены», поэтому он отступает к + и за- 
ставляет его отдать одну из пяти букв. Затем он снова двигается вперед по шабло- 
ну, останавливаясь, чтобы еще раз вывести 11, перед тем как присвоить ђ послед- 
ней точке и успешно завершить поиск. 


Фигурные скобки вокруг фрагмента С00Е напоминают, что это — блок кода на язы- 
ке Регі, и он определенно ведет себя как блок в лексическом смысле. Это означает, 
что если в таком блоке для объявления переменной с лексической областью види- 
мости используется пу, то переменная является частной для этого блока. Но если 
локализовать переменную с динамической областью видимости при помощи 
]оса1, результат может оказаться не таким, как мы ожидаем. Подшаблон (?{С00Е}) 
создает неявную динамическую область видимости, которая действует в остав- 
шейся части шаблона, пока сопоставление не завершится успехом, либо произой- 
дет возврат через подшаблон с кодом. Можно представлять себе это так, будто воз- 
врат из блока по достижении его конца не происходит. Вместо этого осуществля- 
ется невидимый рекурсивный вызов Механизма для поиска соответствия остав- 
шейся части шаблона. Лишь позавершении этого рекурсивного вызова происходит 
возврат из блока и снятие локализации с переменных.! В следующем примере мы 
инициализируем переменную $1 значением 0, включив в начало шаблона подшаб- 
лон, содержащий код. Затем мы находим соответствие любому числу символов 
с помощью .* – но между . и + мы поместим еще один подшаблон с кодом, чтобы 
подсчитать, сколько раз. находит соответствие. 


$_ = ‘1отћогіеп’, 

п/ (24 $1=0 }) # Установить $1 в 0 
( (?{ $1++ }) )* # Обновить $1, даже после возврата 
10гі # Вызывает возврат 

/х; 


Наш Механизм летит вперед, устанавливая $1 в 0 и позволяя .+ проглотить все 
10 символов строки. Встретив в шаблоне литерал 10г1, он отступает и отдает эти 


1 Тех, кто знаком с нисходящими рекурсивными анализаторами, такое поведение мо- 
жет смутить, поскольку подобные компиляторы возвращаются из вызова рекурсивной 
функции, как только что-то вычислят. Механизм же этого не делает: когда он что-то 
вычислит, то уходит глубже в рекурсию (даже выходя из группы в круглых скобках!). 
Нисходящий рекурсивный анализатор находится в положении минимальной рекур- 
сии, когда в конце успешно завершает разбор, но наш Механизм находится в локаль- 
ном максимуме рекурсии, когда в конце шаблона успешно завершает сопоставления. 
Может оказаться полезным мысленно подвесить шаблон за левый край и представить 
себе его как дерево графа вызовов. Если вы можете создать эту картину у себя в голове, 
то динамическая область видимости локальных переменных становится более понят- 
ной. (Если не можете, то хуже вам не станет.) 
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четыре символа из .*. После того, как найдено соответствие, $1 по-прежнему бу- 
дет равна 10 


Чтобы в $1 находилось число символов, которые в итоге окажутся в .*, можно ис- 
пользовать в шаблоне динамическую область видимости: 


$_ = 10 еи‘; 

М (24 $1=0 }) 
(. (?{ 1оса1 $1 = $1 + 1, }) )* # Обновление $1, не зависящее от возвратов. 
1071 
(?{ $геѕи1т = $1 }) # Копировать по нелокализованному адресу. 


/х; 


Здесь посредством 10са1 мы гарантируем хранение в $1 числа символов, найден- 
ных .*, независимо от наличия возвратов при поиске. $1 будет забыта, когда за- 
кончится регулярное выражение, поэтому подшаблон с кодом (?{ $гези = $1 }) 
сохраняет этот счетчик в $геѕи1і. 


Специальная переменная $^В (описанная в главе 25) содержит результат послед- 
него блока (?{С00Е}), выполненного в составе успешного сопоставления. 


Расширение (?С00Е}) можно использовать в качестве условия С0№ в конструкции 
(7(СОМО) ТЕТНИЕТЕЕАЕЗЕ). При этом $" не устанавливается, а круглые скобки во- 
круг условного оператора можно опустить: 


"ОЛурһ" =- /.+(7(?{ $Ғоо{баг} 9% "ѕутро1" }) [ѕідпеї). /; 


Здесь мы проверяем, больше ли $Гоо{раг}, чем ѕутро1. Если да, то в шаблон вклю- 
чается ., аесли нет, то ѕідпеі. Несколько растянув эту команду, можно сделать ее 
более удобочитаемой: 


"оІурһ" =- ті 
.+ # несколько любых 
(2(7{ если 
фҒоо{баг} оі “зутбо1” # это правда 


Е-У 


}) 

# найти еще любой символ 
иначе 
зідпеї # найти ѕЅідпеї 


| 


= 


# и еще любой символ 


ух: 


Когда действует прагма изе ге е», регулярное выражение может содержать 
подшаблоны (?{С00Е}), даже если в них интерполируются переменные: 


/(.*?) (?{1епдти($1) < 3 && магп}) $зиЕ1х/, # Ошибка без изе ге “еуа1“ 


Обычно это запрещено, поскольку представляет собой угрозу безопасности. Даже 
если приведенный шаблон невинен, поскольку невинен $511 1х, анализатор регу- 
лярных выражений не может различить, какие части строки интерполирова- 
лись, а какие нет, ноэтому он просто запрещает все подшаблоны с кодом, если 
производилась интерполяция. 


Если шаблон получен из «меченых» данных, даже изе ге “еуа1” не разрешит по- 
иск по шаблону. 
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Когда действует прагма изе ге `аіпі”, и к меченой строке применяется регуляр- 
ное выражение, сохраненные соответствия подшаблонам (в нумерованных пере- 
менных или списке значений, возвращаемом п// в списочном контексте) помеча- 
ются. Это удобно, если операции регулярного выражения над мечеными данными 
имеют целью не извлечение безопасных подстрок, а просто осуществление дру- 
гих преобразований. Дополнительные сведения о меченых данных см. в главе 20. 
Для этой прагмы заранее скомпилированные регулярные выражения (обычно 
получаемые через дг//) не считаются интерполированными: 


/оо${раї}раг/ 


Это допустимо, если $раї представляет собой скомпилированное регулярное вы- 
ражение, даже если $раї содержит подшаблоны с кодом (?{С00Е}). 


Выше мы привели небольшой фрагмент вывода изе ге 'йерид’. Более простое ре- 
шение для отладки заключается в использовании подшаблонов с кодом (?{С00Е}) 
для вывода соответствия, уже найденного в процессе поиска: 


“арсдеғ" =- / + (?{ѕау “Пока найдено: $& }) .саеР $/х; 
В результате выводится: 


Пока найдено: абсде? 
Пока найдено: абсде 
Пока найдено: арса 
Пока найдено: абс 
Пока найдено. аб 
Пока найдено: а 


Здесь видно, как .+ захватил все буквы, и отдает их по одной — по мере того, как 
Механизм выполняет возвраты. 


Интерполяция шаблона на этапе сопоставления 


Фрагменты шаблона можно создавать прямо в шаблоне. Расширение (7?7{С00Е}) 
делает возможным добавление кода, результатом выполнения которого является 
допустимый шаблон. Похоже на выражение вроде $22' ` 2г" , за исключением то- 
го, что фра егп можно генерировать на этапе выполнения или, точнее, на этапе 
сопоставления. Например: 


Гм (2?{ 1Е ($1һгеѕһо10 > 1) { гед’ } е1зе { “Бе }}) \а/х; 
Это эквивалентно /\мгед\9/, если $1һгеѕһо10 больше 1, и /\мбіие\0/ в противном 
случае. 


Выполняемый код может содержать ссылки на группы только что найденных 
подстрок (даже если позже они окажутся «ненайденными» из-за возврата). На- 
пример, следующая команда находит все строки, которые одинаково читаются 
в прямом и обратном направлении (известные как палиндромадеры, фразы «с гор- 
бом посередине»): 


/` (.+) 7 (27 {диотетефа гемегзе $1}) $/хз, 
Сбалансировать круглые скобки можно так: 


$техї =- /( \(+ ) (.*?) (224 '\)` х 1епоїћ $1 })/х; 
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Это соответствует строкам вида (ѕһағап!) и (((зпагап!))), помещая ѕһағай! в $2. К не- 
счастью, этот шаблон не определяет, сбалансированы ли вложенные скобки. Для 
этого требуется рекурсия. 


По счастливому стечению обстоятельств, существует возможность создавать и ре- 
курсивные шаблоны. Можно заставить скомпилированный шаблон, использую- 
щий (?7С00Е}), ссылаться на себя самого. Рекурсивный поиск оказывается до- 
вольно нерегулярным. В любой книге по регулярным выражениям указывается, 
что стандартные регулярные выражения не способны правильно находить вло- 
женные скобки. И это правильно. Правильно и то, что регулярные выражения 
в Рей не являются стандартными. Следующий шаблон! находит набор вложен- 
ных скобок на любом уровне вложенности: 
$пр = аг{ 
\( 
(7: 


(7> [7()1+ ) # Нескобки без возврата 


(27{ $пр }) # Группировать с найденными скобками 
}* 
\) 


}х; 
Вот как можно с его помощью организовать поиск вызова функции: 


Фғупраї = цг/\м+фпр/; 
"луѓипёоп(1, (2+ (3+4)), 5)" =- /7$#џпраї$/; # Соответствует! 


Условная интерполяция 


Расширение регулярных выражений (?(СОМО)ТЕТВИЕ|ТЕРАЕЗЕ) аналогично оператору 
?: в Рен. Если условие С0№ истинно, применяется шаблон ТЕТРИЕ; в противном слу- 
чае — шаблон ТЕРАЕЗЕ. Условие С0№ может быть ссылкой на найденный текст (выра- 
жаемой как «голое» целое число без \ или $), опережающей или ретроспективной 
проверкой, или подшаблоном с кодом. (См. разделы «Опережающие и ретроспек- 
тивные проверки» и «Выполнение кода на этапе сопоставления» ранее в этой главе.) 


Если условие СОА представляет собой целое число, оно считается ссылкой на со- 
храняющую группу. Рассмотрим пример: 


#1 /иѕг/о1п/рег1 

иѕе Теафиге “зау“; 

$х = 'Рег1 является бесплатным. * 
$у = 'МападегМаге стоит $99.95. ° 


Тогеасй ($х, $у) { 
/5(\м+) (:является|(стоит)) (?(2)(\$\9-) [\и+)/; # Либо (\$\9+), либо \м+ 


Е ($3) { 
зау "$1 стоит денег" # Мападегмаге стоит денег 
} е1ѕе { 


зау "$1 распространяется бесплатно”; # Рег1 распространяется бесплатно 


Обратите внимание, что нельзя объявить переменнук в той же команде, в которой мы 
собираемся ее использовать. Разумеется, всегда можно объявить ее заранее. 
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Здесь СО№ есть (2), что истинно, когда существует ссылка на второй найденный 
текст. Если это так, то (\$\9+) включается в шаблон в этой точке (создавая ссылку 
на найденный текст $3); в противном случае используется \м+. 


Если условие С0№ представляет собой опережающую или ретроспективную про- 
верку, или подшаблон, содержащий код, то определить, надо ли включать ТЕТНИЕ 
или ТЕРАЕЗЕ, можно на основании истинности утверждения: 


/АТ6С]+(7(7<=АА)С[С)$/; 


Здесь в качестве СО№ используется ретроспективная проверка, чтобы найти в ДНК 
последовательность, которая оканчивается на ААб или другую основную комбина- 
циюи (С. 


Альтернативу | ТЕРАЕЗЕ можно опустить. В этом случае шаблон ТЕТРИЕ будет вклю- 
чен в шаблон, как обычно, если истинно С0№, но если условие не истинно, Меха- 
низм перейдет к следующей части шаблона. 


Рекурсивные шаблоны 


Ссылаясь на сохраняющую группу из шаблона, вы добавляете фрагмент, факти- 
чески сохраненный группой, на которую указывает обратная ссылка. 


АВ ( \р{а1рва}+ ) \$+ \1 \0 /х # нумерованная обратная ссылка 
ЛЬ ( \рќа1рһа}+ ) \з+ \09{1} —\6 /х # альтернативный синтаксис 
ЛА ( \р{а1рпа}+ ) \ѕ+ \9{-1} \0 /х # относительная обратная ссылка 


ХЫ (?<мога> \р{а1рпа}+ ) \з+ \К<мога> \6 /х # именованная обратная ссылка 


Во всех этих четырех примерах обратные ссылки используются, чтобы отыскать 
в строке повторяющиеся слова. Но иногда бывает желательно с помощью одного 
и того же шаблона отыскать два разных слова. 


Для этого используется другая конструкция: (?МИМВЕР) снова вызывает шаблон, 
заключенный в нумерованную группу, а (?&МАМЕ) — заключенный в именованную 
группу. (Последняя конструкция напоминает форму &-вызова подпрограммы.) 


/\о ( \р{а1рва}+ ) \з+ (?-1) \6 /х # "вызвать" нумерованную группу 
/АЬ (?<мога> \рќаірћај+ ) \3+ (78могд) \6 /х В “вызвать” именованную группу 


При использовании формы М/МВЕВ ведущий минус указывает, что отсчет групп 
должен производиться справа налево, от текущей позиции, т.е. -1 означает вызов 
предыдущей группы, абсолютную позицию которой в этом случае знать совсем 
не обязательно. С другой стороны, если перед номером стоит знак плюс, (7+МИМВЕВ), 
отсчет выполняется в противоположном направлении, слева направо, от теку- 
щей позиции. 


Можно даже вызвать группу из нее самой, вынудив механизм сопоставления вы- 
полнить рекурсивный вызов. Это вполне нормальное явление. Ниже демонстри- 
руется один из вариантов реализации поиска парных скобок: 


ме СОЗ | (91) )*+ \) Их 


Поскольку весь шаблон заключен в сохраняющие скобки, их можно опустить 
и использовать (?0) для вызова «нулевой группы», под которой подразумевается 
весь шаблон целиком: 


/\ (2. ГОТ (30) )*+ \) /х 
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В данном случае шаблон прекрасно работает, но его работа может нарушиться, 
если определить его с помощью оператора 4г// и задействовать в другом шаблоне. 
В последнем случае следует использовать относительную нумерацию групп. Ни- 
же приводится регулярное выражение, отыскиваклцее идентификатор, за кото- 
рым следуют парные скобки: 


Фғипса11 = дг/\м+ ( \0 (7: ^0) 19+ | (9-1) )*+ \) )/х 
Использовать его следует таким образом: 


мһі1е (<>) { 
ѕау $1 ЇР /^ \ѕ» ( $Рипса1] ) \5* ; \$* $/х; 
} 


В переменной $1 остается только желаемый результат, что удобно. Это пример ко- 
да, не зависящего от абсолютной позиции: он не требует знания абсолютной пози- 
ции в общей схеме. 


Нумерованные группы прекрасно работают в простых шаблонах, но с ростом 
сложности шаблона именованные группы становятся более привлекательной аль- 
тернативой: 


$Рипса11 = аг/\м+ (?<рагеп> \( (?: [7()]++ ' (2?8рагеп) )*+ \) )/х 
мһі1е (<>) { 

зау $+{Рипс} 1Р /^ \з* (7<Рипс> $Рипса11 ) \з* ; \5* $/х, 
} 


По существу, именованные группы - единственный способ сохранить здравомыс- 
лие с ростом сложности шаблонов. 


Обратите внимание, что вложенный вызов не возвращает сохраненный им фраг- 
мент в охватывающий шаблон — он возвращает позицию найденного соответст- 
вия. Зачастую это именно то, что необходимо, потому что позволяет контролиро- 
вать побочные эффекты, но иногда бывает желательно сохранить фрагменты ана- 
лизируемой строки. Подробнее об этом чуть ниже. 


Раз уж речь зашла о разборе текста: как вы, быть может, осознали к этому момен- 
ту, у вас на руках есть практически все необходимое для настоящего анализа. Под 
настоящим анализом мы не имеем в виду простые конечные автоматы, такие как 
МЕГА и "РЕА, а боевой, рекурсивно-нисходящий разбор. Благодаря особенностям 
Ре, описываемым в следующем разделе и далее, шаблоны превращаются в пол- 
ноценный эквивалент рекурсивно-нисходящего анализатора. Добавив пару рю- 
шечек и бантиков, вы без труда сможете писать полноценные грамматики, весьма 
напоминающие файлы уасс или грамматики в форме Бэкуса-Наура (ВасКиз-Майг 
Гог). 


Грамматические шаблоны 


Действие грамматик основано на рекурсивном анализе подшаблонов. Поскольку 
сохраняющие группы могут работать как подшаблоны, их можно использовать 
в качестве порождающих правил грамматик. До настоящего моменты вы еще не 
видели, как определять порождающие правила отдельно от их вызова. 


Очевидно, если использовать сохраняющую группу как подшаблон, не имеет зна- 
чения, применяется ли она фактически для сопоставления с чем-либо. В действи- 
тельности, когда пишутся грамматики, обычно не предполагается, что подшабло- 
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ны будут вызываться сразу же после их определения — вы сначала определяете их 
все, а используете позднее. Что нужно, так это способ указать, что определенный 
фрагмент шаблона служит исключительно для определения, а не для выполнения. 


Именно это делают блоки (?(0ЕҒІ№МЕ)...). Технически — это условная инструкция, 
подобная конструкции (7(С0№)...), описанной выше. Здесь условием является 
ОЕЕТМЕ, и это условие всегда ложное.! Поэтому содержимое блока БЕЕТМЕ гаранти- 
рованно не будет выполняться. 


Теперь самоуверенный всезнайка из аудитории может заявить, что компилятор 
волен удалять неиспользуемый код из тех условных конструкций, где условное 
выражение всегда возвращает ложное значение. Впрочем, преподаватель может 
парировать, что эта политика действует только для исполняемого кода – не для 
объявлений. А группы в блоке ГЕҒІМЕ считаются именно объявлениями, поэтому 
компилятор их не выбрасывает. Они служат подшаблонами, доступными для вы- 
зова в другом месте того же шаблона. 


Таким образом, вот то место, куда можно поместить нашу грамматику. Блок 
РЕҒІМЕ можно определить в любом месте, где только пожелаете, но обычно его рас- 
полагают либо непосредственно перед основным шаблоном, либо вслед за ним. 
Порядок следования определений внутри блока не имеет значения. Поэтому все 
ваши подшаблоны наверняка будут напоминать следующее: 


9г{ 
(?&арѕтгасї_деѕсгірт1оп_ оғ мпат_15_ре1по_патспеа) 
(?(ВЕРТМЕ) 
(?<арѕїгаст_деѕсгірт1оп оѓ _мпат_15_ре1по патспей> 
(?&сотропеп+1) 
(?&сотропепї2) 
(?&сотропепїЗ) 


) 

(?<сотропеп1> .. } 
(?<сотропеп{2> ... ) 
(?<сотропепїЗ> .. \ 


}х: 


Единственный исполняемый фрагмент этого шаблона располагается за предела- 
ми блока ЕРІМЕ: он вызывает первое правило, которое вызывает все остальные. 


Это начинает походить не только на определение грамматики, но и на обычную 
программу. В отличие от привычной формы обработки шаблона слева направо, 
данное определение имеет форму программы, выполняемой сверху вниз и состоя- 
щей из подпрограмм, вызывающих друг друга итеративно и рекурсивно. Невоз- 
можно преувеличить важность этой модели разработки, потому что выбор понят- 
ных имен является единственно важным подходом, упрощающим создание, от- 
ладку и сопровождение шаблонов. В этом разработка шаблонов ничем не отлича- 
ется от обычного программирования. 


1 Да, это «колхоз», но вполне удачный. В противном случае пришлось бы использовать 


постфиксный квантификатор {0}, как в языке Киђу, в ущерб удобочитаемости. 
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И данная модель позволяет сразу заметить отсутствие необходимых абстрак- 
ций - если вы начинаете повторяться, повторяющуюся функциональность, веро- 
ятно, имеет смысл оформить как отдельный именованный элемент. А если вы да- 
дите ему говорящее имя, позволяющее определить, для чего этот элемент слу- 
жит, это упростит организацию и сопровождение кода. Если позднее потребуется 
внести какие-то изменения, достаточно будет сделать это всего в одном месте. 
Подпрограммы были самой первой парадигмой повторного использования кода, 
а подшаблоны - это те же подпрограммы, только замаскированные. 


Такой стиль определения шаблонов быстро вызывает привыкание, стоит только 
попробовать: нетривиальные шаблоны перестают выглядеть как обычные регу- 
лярные выражения и приобретают черты своих мощных собратьев, грамматик. 
Вам больше не придется писать: 


/\6(2=(?=[\р{АТрпабетзь}\р {04941} 1)\Х) (7. (?=[\р{А1рпабеттс}\р{01911} ])\Х 
1[`\х{2019}]1(4=[^\х{2014} 1)\р{дазп} )+(2! (?=[\р{А1рпабет1с}\р{ 01914} 1)\Х|)/ 


Вместо этого вы сможете использовать предпочтительный способ определения 
грамматического шаблона для извлечения слов: 


$мога гх = аг{ (?&опе мога) 


(?(БЕРТМЕ) 
(?<а 1еїтег> (?= [Мр{А1рнабе с }\р{0191%}] ) \Х ) 
(?<ѕоте Іеїтегә> (?: (?ёа Іеїїег) | (?&їіск) | (?ёйаѕћ) ) +) 
(«ск [С\МАТСНТ ЭТМОЕЕ ОУОТАТТОМ МАВК} ] ) 
(?<даѕћ> (= [МЕМ ОАЗН}] ) \оѓдаѕћ} ) 
(?<опе_мога> 
\Ь 


(?= (78а 1еїтег) ) 

(?&5оте_Јеїтегѕ) 

(2?! (?8а 1еїтег) 
(?&ааѕһ) 


) 
) # конец блока определения 
}х: 


Шаблон верхнего уровня просто вызывает подпрограмму опе_могд, которая и вы- 
полняет всю работу. Этот шаблон позволяет вывести все слова в файл, по одному 
в строке: 


МһіТе (/($могд_гх)/) { 
ѕау $1; 
} 


Как демонстрируют эти примеры, иногда грамматическиє шаблоны можно запи- 
сывать, как обычные, неграмматические регулярные выражения, не имеющие 
подпрограмм-шаблонов. Но это крайне неудобно и такие выражения, где все сва- 
лено в кучу, невероятно сложны для чтения, написания, отладки и сопровожде- 
ния. Грамматики расширяют ваши возможности. Многие интереснейшие задачи 
невозможно решить с применением обычных регулярных выражений. Рассмот- 
рим пример задачи, легко решаемой с применением шаблонов Регі, но недоступ- 
ной для решения с помощью обычных регулярных выражений. (Точнее, два та- 
ких примера, один связан с поиском сбалансированных (баіапсед) тегов, а дру- 
гой – зеркальных (тіггогед).) 
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Сама эта книга написана в формате РОР, используемом в системе создания доку- 
ментации Рег. Подробнее о нем рассказывается в главе 23, а здесь отметим лишь, 
что формат РОР немного напоминает любой другой язык разметки на основе 
ЅСМІ,. Он имеет теги и угловые скобки. И как в любом другом языке разметки, 
эти теги могут быть вложенными, что делает бессмысленными попытки поиска 
или манипулирования ими с помощью старых добрых инструментов, основанных 
на регулярных выражениях, таких как почтенный ётер. Теги образуют вложен- 
ные структуры, так что операции поиска и манипуляции тегами также должны 
иметь многоуровневую организацию. А простые регулярные выражения этого де- 
лать не позволяют. К счастью, регулярные выражения в Рег] – это не обычные ре- 
гулярные выражения, поэтому они могут использоваться для анализа весьма за- 
мысловатых документов на таких языках разметки, как ХМГ и НТМГ. И РОР. 


Теги в языке разметки РОР всегда начинаются с одиночной буквы в верхнем ре- 
гистре, за которой следует одна или более открывающих угловых скобок. Пока 
все просто. Вся сложность состоит в том, чтобы отыскать закрывающую угловую 
скобку (или скобки) в конце тега. И сделать это можно двумя способами, в зависи- 
мости от наличия пробельного символа за открывающей комбинацией. 


Х<содержимое> # сбалансированный тег 
Х<< содержимое >> # зеркальный тег 


Если пробельный символ отсутствует, значит вы имеете дело со сбалансирован- 
ным (Ъа]апсей) тегом, где количество закрывающих скобок должно соответство- 
вать числу открывающих, включая любые скобки в «начинке». 


При наличии пробела тег превращается в зеркальный (тіггогед): он завершается 
пробельным символом, за которым следует число закрывающих скобок, соответ- 
ствующее числу открывающих. Внутри тега может присутствовать любое коли- 
чество открывающих или закрывающих угловых скобок, и они н обязаны быть 
парными, так как их число никак не учитывается. 


Ниже приводится несколько примеров тегов из текста книги: 


В<-ОхА<ННН. ..>> 

(<<< >>= >>> 

С<0.. (2У<В<ВТТ$>>)-1> 

(<< В2<><+оџсћ> 57<><В7<><-{> І2<><#іте>> 17<<Ғ11е> >> 
С<(7Е<11>!...)> 

С<< !9дгер { 'А<СОБЕ>->($_) } Кеуѕ В<НАЅН> >> 

С<<< <НАМОГЕ>, <<ЕМ№Ю >>> 
С<(7(В<СОМО> ) А<ІҒТЕЏЕ> | В<ТЕРАЕЗЕ>)У 

(<<< << В<ЕХРА> >>> 

С<5/А<РАТТЕВМ /А<ВЕРІАСЕМЕМТ>/> 

Т<бапта МагЕ<іасиїе>а> 

Х<<< < (1еѓї апо1е Бгаскет); << (1еғї-5һіТЕ) орегатог:@1еѓі1е?ї >>> 


А вот начало определения соответствующей грамматики: 


робтад:: саріта1 еіїһег 
саріїа1:: иррегсазе_1е{тег 
е1їһег:: < бајапсеа | тіггогеа > 


Она легко транслируется непосредственно в подшаблоны: 


(?<родтад> (?&саріта1) (?&еіїһег) ) 
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(?<саріїа1> \рќџоррегсаѕе_Л1еїїег} ) 
(2<еітһег> (?8ба1апсеб) | (?&тіггогеа) ) 


Группа сбалансированных угловых скобок – это просто текст, заключенный в пар- 
ные угловые скобки, такой как В<-0хВ<НННН>>. Мы уже знаем, как отыскивать фраг- 
менты, заключенные в парные угловые скобки, потому что эта задача ничем не 
отличается от задачи поиска парных круглых скобок, которая была решена выше. 


(?<бра1апсед> < ( [“^<>]++ | (?&ба1апсед) )* >) 


Это подводит нас к последней части нашей грамматики, зеркальным тегам. Зер- 
кальные теги — это теги, которые выглядят, как (<< << В<ЕХРН> >>>, В этом случае 
требуется отыскать закрывающие скобки, число которых соответствует числу 
открывающих скобок, при этом не должны учитываться открывающие и закры- 
вающие угловые скобки, находящиеся внутри тега. Ну, почти. 


(7<т1ггогед> (?<ореп> <{2, }+ ) \ѕ++ 
\3+ 
(?: (?8роатад) | \р{Апу} ) *? 
\5+ 
\$++ (77{ ">" х Тепоїћ $МАТСН{ореп} }) 
) 


Сначала группа <т1ггогед> безвозвратно поглощает две или более открывающих 
скобки и сохраняет их в группе <ореп>, чтобы позднее можно было подсчитать их 
количество. Обратите внимание, что здесь именованная группа <ореп> не выделя- 
ется в отдельное именованное правило, так как применение вложенного правила 
скрыло бы найденное соответствие. 


Средняя часть соответствует содержимому тега. Здесь нам следует проявлять ос- 
торожность, потому что это содержимое может включать другие теги РОР, а эти 
теги могут быть сбалансированными. Все, что не является зеркальным тегом, не 
учитывается. Здесь используется свойство \р{Апу}, которое на языке Юникода со- 
ответствует выражению (?$:.) на языке Рей. Иными словами, ему соответствуют 
любые символы, даже символы перевода строки. 


Последняя строка интерполирует результат этого выражения, чтобы сгенериро- 
вать последовательность закрывающих угловых скобок, обнаруженных в строке 1. 


Ниже приводится программа целиком. 


#1 /иѕг/б1п/епу рег1 
# бето-ройтадѕ-соге 


узе у5.14; 

иѕе 5їгісї; 

иѕе магпіпо5; 

оиѕе ореп ам(:51а :01#8); # весь текст в кодировке ИТЕ-8 

иѕе магпіпдѕ РАТА => "иЕЁ8"; # на случай появления ошибок с кодировкой 

изе ге "/х"; # все шаблоны допускают форматирование 

оиг ЯМАТСН; >МАТСН = \%+, н УМАТСН - псевдоним переменной %+ для удобства 
пу $АХ = 9г{ 


Технически это не так. На более высоких уровнях соответствия стандартам, чем чем 
обеспечивает Рег], \р{Апу} может совпадать с такими специфическими национальными 
символами, как комбинации из двух или трех букв. 
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(?(БЕРТМЕ) 
(?<ройїад> (?&сарзта1) (?ёе1тпег) ) 
(?<саріїа1> \р{иррег} ) 
(?<еіїћег> (?&тіггогед) | (?ёба1апсеа) ) 
(?<ра1апсед> < (?8оопепіѕ) > ) 
(?<сопТепіѕ> (7: (7вробфад) | (?&ипапо1е) )* ) 
(?<ипапо1е> ©]+ у 
(2<піггогей> (2<ореп> <{2, }+ ) \5++ 
\ѕ+ 
(? (?8&ройтад) | \р{Апу} ) *? 
\5+ 
\5++ (2?{ ">" х 1епоти $МАТСН{ореп} }) 
) 
) 
} 
@АВСУ = 9100("*. род") 1Ғ @АНСУ == 0 && -1 5Т0ІМ; 
О1е “изаде: $0 [родѕ ]\п” 1+1 @АНСУ == 0 && -1 ТОТИ; 
$/ = ^^ # режим деления на абзацы, поскольку теги могут 
# пересекать \п, но не \п\п 
$1 = 1; # быстрый вывод для нетерпеливых 


мһі1е (<>) { 
мһі1е (/ (2<ТАб> (?8робеад) ) $АХ /9) { 
зау $МАТСНАТАС}; 
} 
} 


Пара замечаний. Чтобы вывести результат сопоставления, его необходимо явно 
сохранить где-то в области видимости. Для этого используется именованная 
группа <ТАб>. Можно было бы использовать $& или ${МАТСН}, однако все, что сохра- 
няется в группах внутри шаблона <родтад>, теряется после возврата из него. 


Этот прием можно использовать для проверки входных данных, но когда дело до- 
ходит до извлечения фрагментов, поиск которых дался таким трудом, начинают 
проявляться недостатки. Можно усеять код вставками ` С00Е .), сохраняющи- 
ми найденные фрагменты, но это быстро превращается в весьма утомительное за- 
нятие. Более удачное решение заключается в использовании вспомогательного 
модуля, который описывается в следующем разделе. 


Модуль Сгаттагѕ 


Дамиан Конвей (ратіап Сопжау) написал модуль Недехр: :бгаттагз (его можно най- 
ти вархиве СРАМ), решающий эту проблему и многие другие. Он упрощает созда- 
ние грамматик на Регі. Модуль просто великолепен, но слишком многогранный, 
чтобы описать его здесь, поэтому подробности ищите на соответствующих страни- 
цах справочного руководства. И все же вот кое-что, чтобы пробудить у вас интерес. 


Модуль Ведехр::бгаттагз в действительности является компилятором грамма- 
тик, напоминающим уасс. Отличие от уасс: вместо программы на языке С 
Ведехр: :бгаттаг$ генерирует шаблон, который можно использовать как любой дру- 
гой. Он делает это за счет одной хитрости, о которой будет рассказываться в сле- 
дующем разделе: он перегружает оператор 0г// и переписывает шаблон, который 
вы ему даете, в другой, который делает всю грязную работу. 
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Ниже приводится версия предыдущей программы, использующая модуль Да- 
миана. 


#1! /иѕг/ріп/епу рег1 
# дето-родтад$-дгаттаг 


у5е м5. 14; 

иѕе ЅЕгісї; 

иѕе магпіпд$; 

иѕе ореп дм(:за : #8); # весь текст в кодировке ЧТЕ-8 

изе магп1пдз РАТА => "иї?8"; # на случай появления ошибок с кодировкой 
изе ге "/х"; # все шаблонь допускают форматирование 


ту $родтад = до { изе Ведехр: :бгаттагз; аг{ 


<роатао> 
<їіокеп: родтао> <саріта1> <еіїһег> 
<токеп: саріїа1> \р{иррег} 
<іокеп: еітһег> <тіггогед> | <ра1апсеа> 
<токеп: Ба1апсед> \< <сопіепіѕ> \> 
<Ттокеп: сопепїѕ> (2: <[родтад]> | <[ипапо1е]> ) * 
<їокеп: ипапд1е> [7<]+ 
<фокеп: тіггогед> <ореп=( \< {2, } )> 
\ѕ+ 
(7: «роатад> | \р{Апу} ) •? 
\5+ 
</ореп> 
}хтз; 
} 
@АВСУ = 9106(“». род”) 1Е @АВОУ == 0 && -+ 5Т0ІМ; 
Чле “иѕаде: $0 [родѕ Ј\п” 1Е @АВСУ == 0 65 - ТТМ; 
$/ = ""; # режим деления на абзацы, поскольку теги могут пересекать \п, но не \п\п 
$1 = 1; # быстрый вывод для нетерпеливых 


мһі1е (<>) { 
мһі1е (/Ф%родтад/9) { 
вау $/{род+ад} {саріта1}, 
$/{родтад} {еісћег} {"") 


} 


Эта программа выполняет анализ тех же входных данных, что и предыдущая — 
определение грамматики выглядит почти так же. Но она лучше во многих отноше- 
ниях. Ее проще было написать, и на наш взгляд она проще читается. Кроме того. 
она делает кое-что, чего не делает предыдущая версия. Взгляните на подпрограм- 
му <піггогед>. Здесь используется одна из возможностей модуля Ведехр: :бгаттагз, 
позволяющая сохранять открывающие угловые скобки в группе с именем <ореп> 
и затем неявно сопоставлять количество закрывающих угловых скобок, просто 
сказав </ореп>. 


Самое, пожалуй, важное заключается в том, что и шаблон, выполняющий сопос- 
тавление, и инструкции вывода немного изменились. Сопоставление теперь вы- 
глядит намного проще, а вот вывод усложнился. Переменная-хеп с именем %/ 
хранит вложенную структуру данных, созданную в результате успешного поис- 
ка, выполненного грамматическим регулярным выражением. 
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В этом листинге не видно, что переменная %/ имеет сложную структуру. Она 
в точности соответствует результатам анализа. Допустим, что на вход программы 
был передан текст: «её С<В<пеѕіеа>> ап [<< М№<штяЧе>ип?4ая >> сеіѕ Х<іпаӣе- 
хед> мен. После его анализа мы воспользуемся модулем Бата: :битр, чтобы пока- 
зать вам, что находится в переменной %/. 


иузе Вата: :Оитр; # из СРАМ 
# выполните сопоставление и затем 
а \%/; # передайте ссылку на хеш с результатами 


И вы получите: 
{ 


“ => "С<В<пезтед?>", 
“родтад” => { 
"7 => "С<В<пезтед>>”", 
“сарафа1“ => "С", 
"еіїһег” => { 
7" => “<В<пеѕтеа>>" 
"ра1апсей" => { 
” => “<В<пеѕїеа>>" 
“сопфепе$” => { 
” => "В<пезтед>“ 
"ройїау" => [ 
{ 
“ => “В<пеѕїед>" 
“сар1фа1” => “В” 


"“е1{нег” => { 
” => “<пеѕіед> `, 
“Ба1апсед” => { 
” => "<пезтед>”, 
“соптепїѕ” => { "” => “пезтед”  ипапд1е => [“пезтед”] } 
} 
}, 
}, 
1, 
}, 
}, 
} 
}. 
} 
{ 


"=> "Т<< №іпѕіде>оп>їад >>” 
“рода” => { 
" => "<< №1пѕіде>ип>+ад >>” 
`сарафа1” => "І" 
"еіїтһег" => { 
“=> "<< №іпѕіде>ип>тад >>", 
"тёггогей” => { 
"=> "<< №іпѕіде>иг>+ад >>", 
“ореп” => "<<" 
"род+ад” => { 
"7 => "М<іпѕійе>" 
"саріїта1” => “№”, 
"еіїһег" => { 
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“ => `<1п51йӨ>”, 
"ба1апсеа" => { 
"=> “<іпѕійе>”, 
“сопёепїѕ" => { “” => “іпѕіде`, “ипапд1е“ => ["іпѕіде"] }, 


"=> "Х<іпдехеа>" 
7родтад" => { 

° => “Х<іпдехед>" 
“саріжа1" => “Х“, 
"еіїһег" => { 

“ => "<іпдехей>", 

"Ба1апсей“ => { 

“ => “<іпдехед>”, 
“соптепт$” => { ““ => ^іпдехей", "ипапд1е“" => ["іпаехеб”] }, 

}, 

}. 
}, 
} 


Как видите, внутри хеша хранятся все результаты применения правил граммати- 
ки, полученные в ходе анализа, включая вложенные теги. Модуль Ведехр: :бгаттаг$ 
обладает намного более широкими возможностями, чем было показано здесь. 
Плюс ко всему, если вам доведется столкнуться с созданием своих грамматик, он 
позволит даже разным грамматикам совместно использовать подпрограммы регу- 
лярных выражений друг друга. Возможности совместного использования намно- 
го шире, чем в простых грамматиках, представленных в предыдущем разделе, где 
нет ни одного совместно используемого элемента. Вам стоит всерьез изучить этот 
модуль, если вы занимаетесь реализацией сложного синтаксического анализа. 
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Нельзя изменить (легко: см. следующий раздел) принциг действия Механизма 
Рен, но те, кому хватит замороченности, могут попробовать изменить то, как Ме- 
ханизм видит шаблон. Поскольку Рей интерпретирует шаблон аналогично стро- 
ке в двойных кавычках, можно использовать чудеса перегруженных строковых 
констант, чтобы избранные нами текстовые последовательности автоматически 
транслировались в другие. 


В примере ниже определяются два преобразования, которые должны происхо- 
дить, когда Рег! обнаруживает шаблон. Во-первых, мы определим метасимвол \іад, 
чтобы при обнаружении в шаблоне он автоматически транслировался в (?:<.*?>), 
что соответствует большинству тегов НТМЬЕ и ХМЕ. Во-вторых, мы «переопреде- 
лим» метазнак \м, чтобы он работал только с буквами английского алфавита. 


Мы определим также пакет с именем Таддег, который укроет перегрузку от нашей 
основной программы. Сделав это, мы сможем сказать: 
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изе Таддег; 
ф = "<І>верблюд</1>"; 
ѕау “Найден верблюд в тегах” і? /\тад\м+\хад/; 


Ниже приводится содержимое файла Табвег.рт, оформленное в виде модуля Рег 
(см. главу 11): 


раскаде Таодег; 
изе оуег1оай: 


зиб ітрогі { оуег1оад. :сопзТапЕ `г` => \&согмегї } 


зиб сопуегЕ { 
ту $ге = ѕһіЁї; 
$ге =- 5/ \\тад /<. *?>/хд; 
$ге =- 5/ \\м /ГА-2а-2]/х9; 
гефигп $ге; 


} 

к 
Модуль Таддег получает шаблон непосредственно перед интерполяцией, поэтому 
обойти перегрузку можно, обойдя интерполяцию, например: 


фге = ‘\тад\м+\тад; я Эте строка начинается с \Е, символа табуляции 
ргіпі 1 /фге/; # Ищет символ табуляции, за которым следует "а". . 


Чтобы преобразовать интерполированную переменную, вызовите функцию сопуегї 
непосредственно: 


$ге = "\Тад\мч\+ас`; # Эта строка начинается с \Е, символа табуляции 
фге = Таддег: :сопуегі $ге; # разыменовать \ад и \м 
ргіпі і? /Фге/: # Фге становится <. *2?>[А-2а-2]+<.»?> 


Если вы все еще не поняли, что это за штуки 516 в модуле Таддег, то скоро поймете, 
потому что этому посвящена глава 7. 


Ал ьтернативные механизмы 


Начиная с версии у5.10, в Рег| появилась возможность подменять механизм регу- 
лярных выражений альтернативными библиотеками сопоставления с шаблона- 
ми. Принцип действия этой возможности описывается в странице регігеарі спра- 
вочного руководства. Описание достаточно сложное и предназначено для техни- 
чески подкованных хакеров. 


Однако удача может улыбнуться вам. Возможно, в архиве СРАМ уже существуют 
расширения для Регі, позволяющие подменять механизм регулярных выраже- 
ний. При их использовании вы пишете свои шаблоны как обычно, и когда прихо 
дит время задействовать их, передаете управление альтернативному механизму. 
В табл. 5.18 перечислены некоторые модули из архива СРАМ, позволяющие ис- 
пользовать механизмы регулярных выражений из других языков в своем коде на 
Рей (по состоянию СРАМ на осень 2011 года). К тому времени, когда вы будете чи- 
тать эти строки, подобных модулей может оказаться намного больше, поэтому 
ищите внимательнее. 
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Таблица 5.18. Альтернативные механизмы регулярных выражений 


Модуль Описание Версия | Обновлен |В текущее время 
сопровождает 
ге: :епдлпе: :ІРЕС Механизм регулярных вы- | 0. 2010-07-09 | Франсуа Перра 


ражений РЕС (Егапс̧оіе Регтаа) 


ге::епдіпе:'ВЕ2 Механизм регулярных вы- 2011-04-22 | Дэвид Ледбитер 
ражений КЕ2 Расса Кокса (Рама 
(Биѕѕ Сох) ГеадБеаіег) 


ге::епдіпе::Р10діп Обобщенный АРІ для раз- 2011-04-05 | Винсент Пит 
работки собственных ме- (Уіпсепё РИ) 
ханизмов регулярных вы- 
ражений 


ге::епдіпе::Р1ап9 Механизм регулярных вы- 2010-08-81 | вар Арнфьорд 
ражений из Р1ап9! Бьярмасон 


(Еуаг Агпбогд 
В}агтазоп) 
ге::епдіпе::Опідигипа | Механизм регулярных вы- 2011-07-10 | ЖЕ 
ражений Опіригита из 
Киру 


ге::епдіпе: 8 Механизм регулярных вы- ў 2008-12-20 | Франсуа Перра 
ражений из языка Гла (Егапс̧оіѕ Реггаа) 

ге::епдіпе::РСВЕ Механизм регулярных вы- 2011-01-29 | Эвар Арнфьорд 
ражений «Регі-СотраїЫе Бьярмасон 


ВеёЕх» Фила Хазеля (РВ (Ауаг Агп# отд 
На2е) Вјагтаѕоп) 


(Заметили что-нибудь необычное в именах авторов? Имена более двух третей из 
них даже невозможно записать символами АБСН. Добро пожаловать в ХХІ век, 
век глобализации!) 


Один из механизмов, а именно – КЕ2 Расса Кокса, заслуживает особого внима- 
ния. Это библиотека на С и С++, которая используется в языке программирова- 
ния Со и в ряде других мест. Самое интересное, что она поддерживает высочай- 
шую совместимость с Рег|, включая отличную поддержку Юникода, и при этом 
избегает потенциальных ловушек катастрофического снижения производитель- 
ности в результате действия механизма возвратов. Как это возможно? В отличие 
от рекурсивного механизма возвратов, используемого в Регі, в КЕ2 применяется 
гибридный подход на основе МЕА/ПЕА, который не подвержен серьезной дегра- 
дации даже в патологических случаях. 


Этот механизм можно успешно применять в критических ко времени выполнения 
приложениях, где необходимо дать пользователю возможность создавать шабло- 
ны, но нельзя допустить, чтобы поиске навечно «завис». Первоначально разрабо- 
танный для проекта компании Соо?]е, Сое ЗеагсЬ (АИр://содезеагсй.вооще.сот), 
где время является существенным фактором, механизм КЕ2 также используется 
через свой Рег-интерфейс на сайте #Ир://вгер.срап.те. Этот сайт позволяет осу- 
ществлять поиск на основе шаблонов по всему архиву СРАМ. 
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Чтобы после установки механизма ге: :епдіпе::ВЕ2! включить его в работу, доста- 
точно просто добавить инструкцию изе ге::епдіпе::ВЕ2 в лексической области ви- 
димости регулярных выражений, для выполнения которых предполагается ис- 
пользовать механизм ВЕ? вместо механизма Реп. Вот и все. 


Ниже приводится пример, где механизм КЕ2 оставляет далеко позади любой ре- 
курсивный механизм с возвратами. Сначала проведем хронометраж обычного 
механизма регулярных выражений в Регі: 


Хх +1те рег1 -Е ‘зау (("а" х 17) =- /ағаға*а*аға*а«аака«[Вь]/і || 0)° 
>/дву/пи11 

1.5640 0.0055 0:01. 57 
Х +1те рег1 -Е "ѕау (("а" х 23) =- /аға*а*а*аға«аакака*[ВЬ1/і || 0)` 
>/деу/пи11 

17.7570 0.0255 0: 17.84 
Х +1те рег1 -Е ‘вау ((“а" х 29) =- /акаға*а*а*а*а*ағаға*[ВЬ]/і || 0)° 
>/дем/пи11 

127.965и 0. 1805 2:09. 20 


А теперь – механизма КЕ2: 


Х жіпте рөг1 -Мгө: :епдіпе: : ВЕ? -Е ‘зау ((“а” х 500) =- 
/а*а*а*а*а*а*а*ака*а*[ВЫ]/і || 0)’ 
>/деу/пи11 

0.0040 0.0025 0:00.00 
Х тіте рег1 -Мге: :епоіпе: :ВЕ2 -Е °зау ((”а” х 5000) =- 
/а*а*а*аға+а*аға*аға*[ВЫ]/1 || 0)' 
>/іву/пи11 

0.0040 0.0025 0:00.00 
х біте рег1 -Мге: : епб1пе: :ВЕ2 -Е ‘зау ((”а” х 50000) =- 
/а*а*а*а*а«а*ағағаға*[ВЫ]/1 || 0)* 
>/дем/пи11 

0. 004и 0.0025 0:00.00 


Как видите, при использовании механизма КЕ2 время выполнения не растет про 
порционально объему входной информации, оно напрямую зависит только от 
размера регулярного выражения. Если входная строка окажется настолько боль- 
шой, что в ней поместится весь архив СРАМ“, это преимущество трудно будет не 
заметить. Да, это несколько надуманный пример, олнако шаблоны удивительно 
часто вызывают проблемы подобного характера. 


Модуль ге::епдіпе::ВЕ2 можно настроить на использование механизма КЕ2 для 
шаблонов, которые он способен будет обработать, и на возврат к использованию 
встроенного в Ре!] механизма для тех шаблонов, которые не могут быть им обра- 
ботаны, что обеспечивает его 100% совместимость. Или, если вы разрабатываете 
внешнюю службу, можно настроить его на использование только КЕ2 без возвра- 
та к встроенному Механизму, и тем самым исключить риск атаки «отказ в обслу- 
живании». 


Дополнительную информацию об архитектуре КЕ2 и о конечных автоматах в це- 
лом можно найти в серии из трех статей Расса Кокса (Киѕѕ Сох): «Кесшаг Ехргез- 
ѕіоп Маісһіпе Сар Ве ЅіппріІе апа Еаѕі», «Бесиаг Ехргеѕѕіоп Маёсһіпе: Тһе Уігіпа] 
Масһіпе Арргоасћ» и «Беғшаг Ехргеѕѕіоп Маѓсһіпу іп {Ве №119». 


1 См. указания в главе 19, если вы еще не знаете, как это сделать. 


Юникод 


Если вы никогда не слышали о Юникоде, вероятно, последние 20 лет вы прожили 
на необитаемом острове и пользовались механической печатной машинкой. Свое 
двадцатилетие Юникод отпраздновал в начале 2010 года. Даже если вы слышали 
об этом стандарте, вы можете не знать, что это такое на самом деле, и как с ним 
работать. Стыдиться тут совершенно нечего, ведь все до единого люди, включая 
и его изобретателей, все еще продолжают изучать Юникод. Мы определенно не 
сможем охватить все нюансы и тонкости Юникода в этой главе и даже в этой кни- 
ге, но мы надеемся помочь вам начать пользоваться Юникодом в Регі. 


Работа с Юникодом в наше время не является вопросом выбора: это насущная не- 
обходимость. Значительная часть текстовой информации в Сети хранится в Юни- 
коде, и многие крупные коллекции документов на 100% хранятся в Юникоде. По- 
скольку веб-браузеры прилагают все усилия, чтобы корректно отображать тексто- 
вую информацию, содержащую любые наборы символов, вы, вероятно, и не заме- 
тили, сколь часто на практике применяется Юникод. Языки программирования 
без качественной поддержки Юникода отстали на десятилетия, как и программы, 
написанные на этих языках. Возможно, они годились для восьмидесятых или дг- 
же для девяностых, но сегодня нам необходимы более мощные инструменты. 


Так что же нас ждет здесь? 


Компьютеры хранят символы в виде чисел. На заре компьютеров то были неболь- 
шие целые числа, имеющие длину 5, 6, 7 или 8 битов. Кодировка ЕВСГГС исполь- 
зовала 8 битов и основывалась на перфокартах. Кодировка АЅСП использует 
только 7 битов, оставляя один бит в каждом байте для других целей – многих, 
многих других целей. порой противоречащих друг другу. 


Так что в те дни практически каждый обитатель западных земель путал симво- 
лы с маленькими числами в диапазоне от 0 до 127 или от 0 до 255. И хотя чисел 
получалось больше, чем клавиш на клавиатуре, их не хватало, и люди в разных 
странах имели собственные представления о том, какие символы должны пред- 
ставлять эти числа. 


1 Вкодировке Юникода ОТЕ-8, если выражаться точно. 
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Такого набора букв вполне хватало, чтобы отправить телеграмму на простом анг- 
лийском языке, но было недостаточно для представления всех символов латин- 
ского, греческого и кириллического алфавитов, не говоря уже об алфавитах, ис- 
пользуемых в Азии. Жителям азиатских стран пришлось определять собствен- 
ные, взаимно несовместимые 16-битные наборы символов. Было чрезвычайно 
трудно, а порой и невозможно включить текст на разных языках в один доку- 
мент, поскольку разные символы из разных алфавитов могли быть представлены 
одними и теми же числовыми кодами. 


Люди привыкли создавать наборы символов, отражающие их потребности в кон- 
тексте собственной культуры. Во всякой культуре люди естественным образом 
ленивы, а потому обычно стремились включать только необходимые им символы 
и исключать ненужные. Такой исключающий подход работает, пока мы общаем- 
ся только с людьми, принадлежащими нашей собственной культуре. Но как 
только мы начали использовать Интернет для обмена информацией между раѕ- 
ными культурами, такой подход стал источником проблем. Не так просто разо- 
браться, как с помощью американской клавиатуры набирать латинские символы 
с акцентами, не говоря уже о более экзотических символах. 


В результате появилась идея создать Юникод: единую систему символов, кото- 
рую можно использовать взаимозаменяемо для набора практически любых тек- 
стов. Юникод охватывает не только современные алфавиты, но и множество 
древних, а также специальные символы, используемые в полиграфии, математи- 
ке, лингвистике и многих других отраслях, включая даже смайлики, используе- 
мые в сотовых телефонах. См. табл. 6.1. 


Таблица 6.1. Примеры символов Юникода 


Асов все $ ВЗР 
об ВГУАё рөл ЕххоссФх ОФ 
аБбджзИик ЛстууФфШьЭЮя 
ЧЧЗЯЕЕхи: 0$ 

хх = ЕбЕЗАОСо (а. К, 

+ ЗЕЕЕС@ЕУРМУ 


Латинские буквы 
Греческие буквы 
Кириллические буквы 
Математические буквы 
Математические символы 


Символы валют 


Точки отага 2. Е 
Дефисы и тире о о, а рае 
Кавычки севин су сэ] 


Как видите, некоторые из них очень похожи между собой. Юникод различает 
символы не по внешнему виду, а по их назначению. В первую очередь Юникод — 
это семантический код, и только потом — код начертания, и то лишь потому, что 
начертание является частью семантики. В отличие от кодировки АБСП, охваты- 
вающей небольшой набор символов и определяющей малое количество свойств 
для этих символов, Юникод охватывает более обширные сферы. Юникод можно 
считать расширенной формой АЗСП с огромным количеством символов. Но Юни- 
код — это не только более обширный набор символов, это также свод правил рас- 
пределения символов по категориям и работы с ними. 


Помимо символов и их свойств, Юникод определяет также: порядок отображения 
регистров символов и приведения символов к единому регистру (свертки); комби- 
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нирующие символы; группы графем; формы нормализации; порядок сопоставле- 
ния; свойства символов для использования при поиске по шаблону, включая име- 
на символов, категории и алфавиты; числовые эквиваленты (например, позво- 
ляющие определить, что число, обозначаемое символом 0+216В, «ХП», имеет зна- 
чение 12); ширину печати; двунаправленность; правила разрыва слов и строк; 
и вариации начертания. Список далеко не полон... 


Первая предварительная поддержка Юникода появилась в Регі у5.6, однако важ- 
ные задачи ввода/вывода нам удалось решить только к Ре! у5.8. К версии у5.12 
мы решили большинство более мелких проблем, и, начиная с версии у5.14, Ре 1 
обеспечивает полную и своевременную поддержку стандарта Юникода версии 
уб.0 — теперь вы можете использовать Юникод в Регі, не прибегая к каким-либо 
ухищрениям. Почти. Во всяком случае, в Рег! этих ухищрений по-любому потре- 
буется меньше, чем в любом другом языке. 


Мы хотим сказать, что сохранили возможность решать простые задачи простым 
способом, при этом не сделав сложные неразрешимыми. Первая простая вещь, на 
которую следует обратить внимание, – Рег! позволяет хранить в строках любые 
символы, с любыми значениями кодов. Кодировка АЗСП ограничивает код сим- 
вола 7 битами, райп-1 – 8 битами, а Юникод поддерживает коды длиной до 21 би- 
та! Но символы в Ре! не ограничены столь маленькими числами. В настоящее 
время на 64-битных архитектурах символы в Ре! ограничены 64-битными зна- 
чениями, но даже с учетом этого ограничения Рей позволяет представлять на 
18 446 744 073 708 437 504 кодов символов больше, чем имеется в Юникоде. (Мы 
ведь сказали «с любыми значениями кодов»? Так-то.) 


В Юникоде каждому символу соответствует уникальный номер, который назы- 
вается кодом символа. Отсюда и происходит название Юникод: уникальный, 
универсальный код для каждого самостоятельного символа. Например, символ 
с именем гАтТІМ САРТТАТ, ТЕТТЕК А имеет порядковый десятичный номер 65, шестнад- 
цатеричный 0х41. Он часто записывается как 0+0041; существующие соглаше- 
ния таковы, что префикс «0+» обозначает не просто число, а число, представляю- 
щее код символа Юникода. 


Если вы когда-нибудь принимали по ошибке 41» за «1», «0» за «0» или <,» за «.», то 
уже знаете, как человек легко может спутать символы. Вы также знаете, что ком- 
пьютер никогда не путается. Для него не имеет значения, как выглядит начерта- 
ние символа в шрифте. Для него важно лишь назначениє символа. Например, 
в табл. 6.2 перечислены символы, которые выглядят почти одинаково при ис- 
пользовании почти любых шрифтов. 


В первой колонке табл. 6.2 приводится начертание символа. Вы сможете исполь- 
зовать литералы Юникода, подобные этим, в своем программном коде, только ес- 
ли в текущей лексической области видимости действует прагма изе иїё8. Боль- 
шинство современных текстовых редакторов и оконных систем предоставляет 
различные способы ввода таких символов, однако они могут быть отключены по 
умолчанию, поэтому может потребоваться провести небольшие исследования, 
если вы не слишком ленивы. Но постойте, вам может пригодиться и такой спо- 
соб: если вы не знаете, как ввести тот или иной символ, его можно попробовать 


1 Наделе эта длина составляет лишь 20,087463 бита, поскольку Юникод содержит лишь 
0х110000 кодов, а не 0х200000. 
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отыскать где-нибудь, выделить мышью, скопировать в буфер обмена и вставить 
в свой текст. 

Таблица 6.2. Символы Юникода, которые легко перепутать с буквой А 


Начертание Категория 


ТАТТМ САРГТА\, ГЕТТЕВ А 
ЕОГЛМТОТН Т.АТІМ САРГТАТ, Т.ЕТТЕВ А 
СКЕЕК САРТТАГ, ТЕТТЕВ АТРНА 
СУВИЛЛС САРІТАТ. ГЕТТЕВ А 


МАТНЕМАТ1САГ ЗАМ№ `БЕКІЕ САРІТАІ, А 


> > > > р р 


МАТНЕМАТІСАІ, МОМОЗРАСЕ САРІТАТ, А 


Если отвлечься от внешнего вида, начертание, в некотором смысле, является 


наименее полезным асиектом символа, потому что невозможно знать, как тот или 
иной символ отображается (и отображается ли вообще) с применением какого-ли- 
бо другого шрифта, кроме того, что используете вы сами. У вас начертание может 
выглядеть очень неплохо, но не верьте своим глазам — верьте числам. Во второй 
колонке указаны числовые коды символов, в стандартном формате Юникода. 
А вот несколько способов работать с кодами символов Юникода в языке Регі: 


1Е (ога($ѕотесһаг) == 0х0391) { .... } 
$а1рһа = ”\х{391}"; 

$а1рһа = "\0+391}"; 

фа1рһа = сһг(0х391); 


Двумя наиболее важными свойствами символов, помимо их числовых кодов, яв- 
ляются: принадлежность к категории (колонка «Категория» в табл. 6.2) и при- 
надлежность к алфавиту (колонка «Алфавит» в табл. 6.2). В шаблонах свойства 
кодов символов Юникода чаще всего используются в роли именованных классов 
символов, где \р{РЯОРЕПТҮ} соответствует любому коду символа с данным свойст- 
вом, а \Р{РАОРЕРТУ} соответствует любому коду символа, не обладающему данным 
свойством. 


/\р{6б=Ьи}+$/ # Все заглавные буквы 
/\різсгірї=б6геек}+$/ # символы греческого алфавита 
/{\Р{ѕсгірё=Гатіп}\Р{ѕсгірі=Соттоп) ]/ # не пересекаются 


Последний шаблон соответствует строкам, содержащим любые коды символов, 
не принадлежащие алфавитам Гаїіп и Соттоп. Поскольку регистр символов, 
наличие пробелов и символов подчеркивания в именах свойств не имеет большо- 
го значения, вы можете форматировать их как вам заблагорассудится. То есть, 
если вам покажется, что \рідс=подіѓіег Іеїїегг читается лучше, когда использу- 
ются только символы нижнего регистра, а \Р{5С=ТМНЕВТТЕО} — когда используются 
только символы верхнего регистра, пишите как нравится: Ре! об этом не беспо- 
коится. Или поступите наоборот, если вам того захочется. 


Помимо показанных выше свойств, состоящих из двух частей, для обозначения 
категорий и алфавитов Рег] предлагает также односоставные псевдонимы, что 
позволяет написать просто \р{1и} и \р{бгеек}. Например, если вам потребуется 
убедиться, что строка содержит только символы из алфавитов Гайп и Сгеек, дос- 
таточно выполнить следующую проверку: 
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фту]апд = аг/[\р{атіп}\рібгеек}\р{ Соттоп }\р{Іпіегіїеду 1/; 
1? ($3г1пд =- /\АфтуЈапд+\2/) { .. } 


Мы добавили псевдоним Соттоп для обозначения кодов символов, общих для 
различных алфавитов, таких как цифры и знаки пунктуации, а псевдоним 
Іпһегіќеа — для обозначения комбинационных кодов символов (как правило, ди 

акритических знаков), которые присоединяются к алфавиту символа, с которым 
используются. Комбинационные коды символов не имеют аналогов в АБСП, и, 
случается, сбивают с толку тех говорящих на АЗСП, кто впервые знакомится 
с Юникодом. Пожалуй, наиболее близким понятием в АЗСП является перечерки- 
вание с использованием символа забоя, за исключением того, чтс в Юникоде ком- 
бинационный код автоматически применяется к предшествующему базовому ко- 
ду. Подробнее о них рассказывается ниже, в разделе «Графемы и нормализация». 


Вы могли заметить, что в этой главе мы проводим различие между «символом» 
И «кодом» или «кодом символа». В других местах (включая другие главы этой 
книги) данные термины часто используются взаимозаменяемо, и термин «сим- 
вол» также часто используется вместо термина «графема», но в данной главе нам 
требуется чуть большая точность. Коды – это целые числа, составляющие стро- 
ку, когда она считается списком целых чисел, тогда как «символ» — достаточно 
расплывчатый термин, который в человеческом понимании может означать и код 
(или кодовый пункт), и графему. В общем случае следует помнить, что слово 
«символ» в разговоре может иметь до трех-четырех различных смыслов. 


Последняя колонка в табл. 6.2 содержит имена символов. ОЙ, т.е. названия кодов 
символов. Чтобы получить возможность называть коды по именам в тексте про- 
граммы, имена сначала нужно загрузить при помощи модуля сһагпапеѕ, а потом 
записывать в форме \\{...}, как показано ниже: 


иѕе сһагпатеѕ 9м( ° #011); 


$а1рһа = "\А{САЕЕК САРТТАЕ ГЕТТЕВ АЁРНА}”; 
Фа1рһа соде = ога “\№МЕВЕЕК САРТТАЕ ГЕТТЕА АЁРНА}”; 
ЇР ($5119 =- /АМСНЕЕК САРТТАЕ ТЕТТЕЯ АЁРНА}/) { } 


Пользоваться названиями кодов символов намного правильнее, чем их числовы- 
ми значениями, поскольку имена делают текст программы более понятным. 


Другие интересные приемы, основанные на использовании формы записи \№...}, 
приводятся в разделе «сһагпатеѕ» главы 29. 


Не рассказывай, а показывай 


Если картина стоит тысячи слов, то возможность вставлять в программу те или 
иные символы определенно стоит не меньше пятидесяти. Поэтому для начала не- 
обходимо сообщить Реті, что текст вашей программы содержит символы Юнико- 
да, а не простые байты. Вас никто не обязывает делать это, но данный шаг немно- 
го облегчит жизнь, если вам потребуется вставить в программный код символы 
Юникода. 


1 Возможно, вы предпочитаете называть их «октетами»; пусть так, но мы считаем эти 


два слова близкими синонимами, поэтому мы будем придерживаться терминологии, 
более близкой технарям. 
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Рей по сей день предполагает, что все модули с исходными текстами содержат 
только символы АЗСН, если явно не указано иное (хотя мы осознаем, что рано 
или поздно кодировкой по умолчанию станет Юникод). Вы всегда можете опреде- 
лять кодовые пункты Юникода с помощью приемов, упомянутых выше, но лите- 
ралы всегда будут интерпретироваться как отдельные байты. Встретив литерал 
символа в кодировке ОТЕ-8, Рег] не посчитает его одним логическим символом, 
а будет рассматривать его как один, два, три или даже четыре отдельных симво- 
ла, с порядковыми номерами, не превышающими 256. Чтобы этого не случилось, 
используйте следующие объявления: 


и5е м5. 14; # включает механизм ип1соде_$1г119$ 
иѕе иї?8, # обрабатывает литералы в кодировке ШТЕ-8 


Первое гарантирует, что кодовые пункты с порядковыми номерами в непростом 
диапазоне 128—255 будут интерпретироваться как строки Юникода, а второе со- 
общает компилятору Рег1, что файл в целом содержит текст Юникода в кодиров- 
ке ОТЕ-8. Прагма иїї8 позволяет использовать Юникод в литералах строк и регу- 
лярных выражений. 


пу ФӧмагЕ? = "Бӧгіпп Еікіпѕкја101": 
ту $ѕеагсп = "Баздиеда”; 

пу $теаѕиге = “Алаз+гбм”: 

пу $ћом = “4, ФИЙ ге-ссеиг”; 

ту Фото = Ч"; 


Такой текст намного проще читается, хотя набрать его может оказаться не так 
просто, как вот этот эквивалент: 


иѕе сһагпатеѕ дм( : ?и11), 


"УМ{САТІМ САРІТАІ ТЕТТЕВ ТНОВМ}\М{1АТТМ ЅМАЦ ЕЕТТЕЕ 

О МІТН АСИТЕ} гіпп ЕіКіпѕкја101”; 

ту $ѕеагсһ = "Б\МІАТІМ ЗМАГЕ ГЕТТЕА Ц МТТН АСОТЕ} здиеда , 

ту Фтеазиге = "А\М{СОМВІМІМС ВІМС АВОУЕ}поѕго\М{ СОМВІМІМС ОТАЕВЕЗТ$ } т”; 


пу $0магЕ 


ту Фһом = "\МІАТІМ МАЦ. ТЕТТЕН А МТТН СВАУЕ} сопіге-с\\М{ГАТІМ 
МАСЫ _ІСАТОВЕ ОЕ}иг"; 
ту Фото = "\А{РАМІСҮ}\МОВОИТМС НЕААТ}\М{ОВОМЕВААУ САМЕ)”; 


При этом оба способа, представленные выше, предпочтительнее использования 
секретных кодов в тексте программы: 


ту Фдмаг? = “"\х{рЕ}\Х{ЕЗ}гіпп ЕіКк1пѕКкја101`; 
ту фѕеагсћһ = "Б\х{РА}здиеда”; 

пу $шеаѕиге = "\х{С5)}поѕіг\х{Еб}т”; 

ту Фһом = "\х{ЕО} сопїге-с\х{153}иг”, 

пу фиоо = `\х{1Е46бА}\х{1Е497}\х{1Е42А} ; 


Но и это еще не все. В области действия прагмы 118 появляется возможность ис- 
пользовать Юникод в идентификаторах Ре!|. 


# несколько наборов символов 

ту 6150 = ам( 1а@п1 (атіп2 таф1п15 ); 
ту @рзоРЕ = ам( ср852 ср1251 ср1252 ); 
пу 68 = ам( Кої8-? Ко18-и Ко18-г ); 
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# включать ли ответы, которые не возвращают результатов 
ту ФІМСОША МІМСОМОЅ = 0; 


# имеют ли значение диакритические знаки 
ту $51 ІМРОВТАМ_ МАРСАЅ ОТАСАІТІСАЅ = 0; 


# считайте << за оператор “имеет” .) я 
ту @с1идаае$_езрайолаз = огаепаг_а 1а еѕрайо1а(<<'1А ШІТІМА` =- /$.*\$/9); 


ГА ОЛТІМА 
ту $деја ітргітёе: # название города 


# Идентификатор на греческом языке 
му @ОпёррЕуас = ( ); 


ВА теперь мы просто выпендриваемся >97) 
ту фапазпо = иморәртѕдп($іприї); 


На практике, если вы будете использовать идентификаторы не на английском 
языке, вам, вероятно, захочется писать комментарии на соответствующем языке. 
Рей упрощает возможность писать программы на собственном языке для людей 
во всем мире, не вынуждая их изучать английский язык. 


В настоящее время вы должны ограничить применение Юникода только приват- 
ными переменными. Это обусловлено особенностями хранения глобальных пере- 
менных, а также особенностями отображения имен модулей в имена файлов в ло- 
кальной файловой системе. Первое ограничение, как ожидается, будет снято 
в ближайшем будущем, а вот второе пока остается предметом для исследования. 


Доступ к данным в Юникоде 


Для целей внутреннего хранения любых кодов символов Рег| применяет формат, 
совместимый с Юникодом. То есть 21 младший бит Е точности соответствует диа- 
пазону кодов Юникода, так же как 8 младших битов Юникода соответствуют ко- 
дировке Гаёіп-1. Как фактически хранятся коды символов, не так важно для ря- 
дового пользователя Регі. 


При этом, как только возникает необходимость взаимодействовать с внешним 
миром, приходится предусматривать соответствующую интерпретацию получае- 
мых данных и генерировать выходные данные в формате, приемлемом для при- 
нимающей их программы. Внутри Рег! символы декодируются из внешнего пред- 
ставления в абстрактные символы, но когда требуется вывести эти символы, их 
необходимо закодировать в некоторое ожидаемое представление. Если забыть 
сделать это, программа сгенерирует то, что иногда называют «широкими симво- 
лами» (м14е сһагасёегѕ) или «неправильно сформированными символами ОТЕ-8» 
(паШогшей ОТЕ-8 сһагасёег). 


В Рег] имеется два основных способа определить кодировку для всего потока дан- 
ных, плюс различные сокращения, упрощающие жизнь. Если поток ввода/выво- 
да уже открыт, его кодировку можно установить, передав ее в качестве второго 
аргумента функции 01пподе: 


292 Глава 6 Юникод 


біптоде(5ТрІМ, “:епсо91п9(СР1252)“) 

11 діе "сап `1 біптоде їо ср1252: $!" 
біптоде(5ТрОТ, " :епсодіпо(уТЕ-8)") 

|| діе "сап' біптоде їо ИТЕ-8° $! 


Если поток еще не был открыт, кодировку можно назначить вместе с режимом 
при вызове функции ореп. 


ореп(О0ТРОТ, "> :гам : епсодіпо(ОТЕ-161Е) :сг1?“, ф#11епате) 
ог діе "сап'ї ореп $Ғі1епате: $! “: 

ргіпі ОШТРОТ Рог @ЅТ0ҒҒ; 

с10оѕе(ОуТРОТ) ог діе “сои1ап + с1оѕе $#і1епате: $!”; 


При выводе данных фильтр :сг1ѓ выполняет преобразование символов \п в пары 
\Г\п; при вводе – наоборот. Этот режим действует по умолчанию в У п9до\з, при 
работе с текстовыми файлами, но, если это необходимо, его следует явным обра- 
зом включать в ОМХ. См. страницу РейШО справочного руководства, где приво- 
дится дополнительная информация о фильтрах ввода/вывода. 


Помимо \п и \г\л в Юникоде существуют и другие символы завершения строк. 
В настоящее время таких последовательностей в Юникоде существует восемь- 
семь перечисленных ниже символов, плюс последовательность \г\п, состоящая 
из двух кодов: 


+000А ЕТМЕ РЕЕО (1Е) 
+0008 _ІМЕ ТАВИГАТТОМ 
0+000С РОВМ ҒЕЕО (ЕР) 
+0000 САВВТАСЕ ВЕТИВМ (СВ) 
(+0085 МЕХТ ІТМЕ (№.) 
+2028 |ТМЕ ЗЕРАВАТОВ 
(+2029 РАВАСВАРН ЗЕРАВАТОВ 


В Рег] нет специального фильтра обобщенной обработки последовательностей за- 
вершения строки Юникода, но, если вы можете позволить себе прочитать файл 
целиком в память, то легко сможете преобразовать все такие последовательности 
в символы перевода строки: 


$сотр1ете_111е =- з/\В/\п/9; 


Или разбить содержимое файла на список строк, не имеющих последовательно- 
стей завершения строки: 


©11пез = 5рі11(/\н/, $сотр1ете_Р11е), 


Чтобы назначить кодировку для вновь открываемых файлов, можно воспользо- 
ваться прагмой ореп. Например, ниже показано, как организовать использование 
кодировки ОТЕ-8 для всех файлов, которые будут играть роль стандартных пото- 
ков ввода/вывода — УТОТА, ЗТООЦТ и ЗТОЕВЕ — если при открытии кодировка не была 
указана явно: 


изе ореп дм( :епсодіпо(уТЕ-8) :5їа ) 


Если вам достаточно назначить кодировку ОТЕ-8 для стандартных потоков, мож- 
но при необходимости пользоваться ключом командной строки -С$ или устанав- 
ливать переменную среды РЕВЕ_ОМТСООЕ в значение “5". Если вместо “5” использо- 
вать значение "0", все дескрипторы будут открываться в текстовом режиме и с ко- 
дировкой ОТЕ-8 по умолчанию. См. главу 17. 
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Использование ключа командной строки -С или переменной среды РЕНЕ_ОМТСОВЕ 
требует явного вызова функции 01пподе для двоичных потоков даже в програм- 
мах для ОМХ, что обычно требуется только в Міпӣоуѕ или в переносимых про- 
граммах. Это может нарушить работу уже имеющихся программ для ОМІХ, 
предполагающих, по умолчанию, что они работают с двоичными данными, а не 
с текстом. Но это не нарушит работу существующих программ, которые не умеют 
декодировать текст в кодировке ОТЕ-8. 


Ниже перечислены механизмы назначения кодировки для потока ввода/вывода, 
следующие в порядке убывания приоритета (механизм, расположенный выше, 
может переопределить настройки, выполненные с помощью механизма, располо- 
женного ниже в списке): 


1. Явный вызов 0іпподе для уже открытого дескриптора. 
2. Включение фильтра во второй аргумент функции ореп. 
8. Прагма ореп. 

4. Ключ командной строки -С. 

5. Переменная среды РЕНЕ_ПМТСООЕ. 


Единственным исключением является дескриптор ОАТА. На него не действуют 
прагмы изе џиї#8 и ореп, поэтому при необходимости вам придется указывать ко- 
дировку вручную: 


6зпподе(рАТА. ‘:епсооїпо(уТЕ-8)"); 


Из-за особенностей реализации уровней кодирования 118 и ЏТЕ-8, обычно они не 
возбуждают исключения, встречая неправильно сформированные входные дан- 
ные. Ч-обы исправить ситуацию, добавьте в свой код следующую строку: 


у5е магп1п9$ РАТАЁ => “и{Р8”; 


В Рец (начиная с версии у5.14) существует три подгруппы предупреждений, со- 
ставляющие группу предупреждений "118". Эти типы предупреждений бывает 
полезно различать: 


попсћаг 


66 кодов символов Юникода считаются «несимвольнымия. Все они относятся 
к общей категории Опаѕѕієпеа (Сп) и никогда не будут сопоставлены каким- 
либо символам. Они не могут использоваться в открытом обмене, поэтому про- 
граммный код может добавлять их в символьные данные в качестве различ- 
ных сигнальных меток, и такие метки всегда можно отличить от основных 
данных. 32 несимвольных кода занимают диапазон от О+ЕОО0 до О+ЕБЕЕ, 
а еще 34 располагаются парами в конце каждого сегмента (их шестнадцате- 
ричные коды заканчиваются, соответственно, последовательностями ЕЕЕЕ 
или ЕЕЕЕ). В некоторых ситуациях может потребоваться разрешить присут- 
ствие таких несимвольных кодов, например, для организации взаимодейст- 
вия между процессами, совместно использующими одни и те же сигнальные 
маркеры. В таких случаях используйте: 


по магпіпоѕ “попспаг”; 


зѕигговаїе 


Эти кодовые пункты зарезервированы для использования в кодировке УТЕ-16. 
На практике нет никаких причин разрешать их использование, и никакие 
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совместимые процессы не смогут обмениваться ими, потому что программы, 
использующие кодировку ОТЕ-16, не способны обрабатывать их (хотя, про- 
граммы, использующие кодировки ОТЕ-8 и ОТЕ-32, могли бы использовать 
их при желании). 


поп итсоае 


Максимально допустимый код символа в Юникоде имеет значение О-+10ЕЕЕЕ, 
но Ре] способен символы с любыми кодами, вплоть до максимального беззна- 
кового целого, поддерживаемого аппаратной архитектурой. В зависимости от 
различных настроек и фазы Луны, Регі может предупредить о попытке ввода 
или вывода кодов, выходящих за верхнюю границу (используя категорию пре- 
дупреждений «поп_ип1соде», которая является подкатегорией «иїЁ8»). На- 
пример, “ис(0х11_0000)" вызовет такое предупреждение, вернув входной пара- 
метр в качестве результата, так как кодовым пунктом верхнего регистра лю- 
бого кода символа, не принадлежащего Юникоду, является этот же код. 


Из перечисленных подгрупп самой полезной является содержащая коды, выхо- 
дящие за границы Юникода, и вы наверняка пожелаете разрешить использова: 
ние таких символов для внутренних нужд. 


по магтіпдѕ "поп _ип1соде"; 


Вот одно из возможных ирименений. То, что следующая операция делает для 
АСП: 


тг[\х00-\х7Е1\х80-\хЕЕ]; 
операция ниже делает для Юникода: 
Еи[\х{00_0000}-\х{1С_РЕЕЕ} ][\х{20_0000}-\х{30_РРЕЕ} 1; 


Она отображает все коды из допустимого диапазона в соответствующие им сим- 
волы из недопустимого диапазона. Зачем это может понадобиться? Это один из 
способов пометить текст, который не должен затрагиваться поиском. Только не 
забудьте выполнить обратное преобразование, завершив поиск. 


Модуль Епсоде 


Стандартный модуль Епсоде используется чаще неявно, чем явно. Он загружается 
автоматически всякий раз, когла функции о1птобе или ореп передается аргумент 
:епсоаіпо(ЕМС). 


Но иногда приходится иметь дело с фрагментами кодированных данных, источ- 
ником которых не служит поток ввода с назначенной кодировкой, поэтому возни- 
кает необходимость декодировать их вручную, прежде чем приступать к их обра- 
ботке. Такие кодированные строки могут поступать в программу из разных источ- 
ников за ее пределами, — скажем, из переменных среды, аргументов командной 
строки, параметров ССІ или полей базы данных. Увы, иногда вам даже придется 
сталкиваться с «текстовыми» файлами, содержащими строки сразу в нескольких 
кодировках. Вы обязательно столкнетесь с кракозябрами. 


Во всех этих ситуациях вам придется обратиться к модулю Епсоде, чтобы реали- 
зовать явное кодирование и декодирование данных. Чаще всего вам придется ис- 
пользовать функции (сюрприз!) епсоде и десойе из этого модуля. Если у вас имеют- 
ся необработанные внешние данные, хранящиеся в некоторой кодированной 
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форме в виде байтов, передайте их функции 0есоде и превратить в абстрактные 
символы. С другой стороны, если у имеются некоторые абстрактные символы, 
и необходимо преобразовать их в некоторую кодированную форму, воспользуй- 
тесь функцией епсоде. 


изе Епсоде дм(єпсоде десобе), 
фсһагѕ = десоде("ѕһіғіјіѕ", $0бутеѕ); 
$рутеѕ = епсоде("МІМЕ-Неадег-150_2022_ ЈР”, $свагз); 


Например, если известно, что терминал настроен на работу с кодировкой ОТЕ-8, 
декодировать содержимое @АНбУ можно следующим образом: 


# действует так же, как рег1 -СА 
1 (огер /\Р{АЅСТІ}/ => @АВбУ) { 

@АВСУ = тар { десоде(“ОТЕ-8", $_) } @ААСУ; 
} 


Если ваша рабочая среда не предлагает повсеместную поддержку кодировки 
ОТЕ-8, не следует исходить из предположения, что терминал всегда настроен на 
использование кодировки ОТЕ-8. Для него может быть установлена националь- 
ная кодировка. Стандартный модуль Епсойе не поддерживает операции, чувстви- 
тельные к региональным настройкам, однако в архиве СРАМ имеется модуль 
Епсоде: :1оса1е, поддерживающий такие операции. Используйте его следующим 
образом: 


иѕе Епсоде; 
иѕе Епсоде: : [оса1е; 


# использовать "1оса1е" как аргумент епсоде/десоде 
@АВСУ = тар { десоде(1оса1е => $_) } @АВб\; 


# или как поток для біптоде или ореп 
біптоде $ѕоте_#һ, ‘:епсо91п9(1оса1е)”: 


ріптоде ТІМ, `:епсодіпо(сопѕо1е іп)" 1Р -Е ТОТИ; 
ріптоде 5ТрО0Т, ":епсодіпо(сопѕо1е_оиё)" 1# -& $ТОбИТ 
ріптоде ЗТОЕАВ, ^ :епсодіпо(сопѕо1е ои)“ 1+ -Е ЗТОЕВЕ, 


Базы данных – еще одна область, где может пригодиться возможность выполнять 
кодирование и декодирование вручную. Конкретика, впрочем, зависит от исполь- 
зуемой системы управления базами данных. Если речь о простых ОВМ-файлах, 
нижестоящая библиотека работает с байтами, а не строками кодов символов, по- 
этому текст Юникода нельзя записать непосредственно в файл ЭВМ. Если попы- 
таться сделать это, программа возбудит исключение М1йе сһагасїег іп зибгои те. 
Чтобы сохранить пары ключ/данные в ОВМ-хеше %00ћаѕћ, их нужно сначала пре- 
образовать в кодировку ОТЕ-8: 


изе Епсоде ом(епсоде десойе), 


# предполагается, что $ипі кеу и $ип1 уа1џе - строки 
# абстрактных символов Юникода 


$епс_ кеу = епсоае{("ИТЕ-8", Фипа_кеу); 
фепс_ма1ие = епсоде(“ОТЕ-8", Фип1_ма1ие); 
фабпазН {$епс_кеу} = Фепс_ма1ие; 
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Отсюда следует, что обратная операция извлечения значения в Юникоде требует 
сначала закодировать ключ перед его использованием, а затем декодировать из- 
влеченное значение: 


иѕе ОВ Рі1е; 
иѕе Епсоде дм(епсоде десоде); 


їе %дрһаѕһ, “ОВ_Р11е”, ‘рафИпаме”, 


# $ипі кеу хранит обычную строку Рег1 (абстрактные символы Юникода) 
Фепс_Кеу = епсоде("ШТЕ-8", $ипі Кеу), 


$епс_уаїџе = $@0ћаѕћ{ епс. кеу}; 
фипі уа1џе = десоде(“ОТЕ-8`, $епс_ма1ие), 


После этого полученную строку $ипі уа1ие можно использовать как любую дру- 
гую строку Рен. Хотя перед этим она была лишь последовательностью байтов — 
целых чисел, хранящихся в форме строки. (И эти целые числа ничем не напоми- 
нали коды символов Юникода.) 


Начиная с версии у5.8.4 появилась возможность использовать стандартный мо- 
дуль ОВМ_Е1 ег для прозрачного кодирования/декодирования данных. 


изе ОВ_Е11е; 
изе ОВМ_Е11Тег; 


изе Епсоде ди(епсоде десоде), 


$96063 = т1е %арһаѕһ, “ОВ_Е11е”, “раһпате”; 
фаробј->Рі1+ег Ма10џе( “ит 8”); 


# Фипр кеу содержит обычную строку Рег] (абстрактные символы Юникода) 
фипі ма1џе = $Обпазй{Фип1 _кеу}; 


Ошибочные представления о регистре 


Если вы знакомы только с набором символов АСП, практически все ваши пред- 
положения относительно регистра символов Юникода будут ошибочны. В АБЗСПИ 
существуют буквы верхнего регистра и буквы нижнего регистра. но в Юникоде 
существует еще третий регистр - заглавный. Этот регистр не имеет широкогс ис- 
пользования в английском языке, но применяется в других системах письменно- 
сти, основанных на латинском или греческом алфавите. 


Обычно заглавный регистр совпадает с верхним регистром, но не всегда. Он ис- 
пользуется, когда только первая буква должна быть болышой. Некоторые симво- 
лы Юникода выглядят как две буквы, напечатанные рядом друг с другом, но 
в действительности представлены одним кодом символа. В слове, где только пер- 
вая часть может быть большой, но не остальные, заглавный регистр позволит вы- 
делить размером лишь установленную часть. Эта возможность существует в ос- 
новном для поддержки устаревших кодировок, и в настоящее время чаще приме- 
няются коды символов, для которых заглавный регистр отображается в два раз- 
личных кода, один в верхнем регистре и один в нижнем. Ниже демонстрируется 
один из таких устаревших символов: 
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иѕе у5. 14. 

изе спагпатез ам(:Ри11); 

пу Фреаѕї = “\М{АТІМ МАС: ГЕТТЕВ 07}иг”, 
ѕау Рог $0еаѕї, исѓігѕї($беаѕї), ис($6еаѕї), 


Он выведет три слова: «ати», «Охиг» и «0206», каждое из которых состоит из 
трех кодов. 


Некоторые буквы не имеют регистра, а некоторые небуквы имеют. Регистр букв — 
относительно редкое явление в системах письменности. Лишь восемь алфавитов 
из почти 100, поддерживаемых Юникодом версии уб.0, имеют регистровые сим- 
волы: Агтепіап, Сорііс, СугШіс, ЮРеѕегеё, Сеогё1ап. СлавоЦ с. СгееК и Гай, 
плюс некоторые из алфавитов Соттоп и Іпћегіќеа. 


При изменении регистра символов может измениться и длина строки. При про- 
стом изменении регистра (ѕітріе сазетаррта) измененная строка всегда имеет 
ту же длину, что исходная, но при полном изменении регистра это совершенно не 
обязательно. Например, строка «ёзс ВИ» после преобразования в верхний регистр 
«ТЗСНО$$» становится на один символ длиннее. 


Разные строки в одном регистре могут отображаться в одну и ту же строку в дру- 
гом регистре. Обе сигмы греческого алфавита, «б» и «с», отображаются в одну 
и ту же букву верхнего регистра, «У», и это лишь самый простой пример. Чтобы 
достаточно разумно (или, хотя бы, не так безумно) решить проблему с подобными 
превращениями, было введено понятие свертки регистра, применяемой для срав- 
нения символов без учета их регистра. Если после свертки регистров символов 
в двух строках получаются одинаковые строки. они по определению считаются 
эквивалентными без учета регистра символов. 


Сопоставление без учета регистра символов в Рей всегда поддерживалось моди- 
фикатором шаблонов /1, который сравнивает результаты свертки регистров. На- 
чиная с версии у5.16, поддерживается функция їс, позволяющая сравнивать ре- 
зультаты свертки регистров двух строк, чтобы определить, являются ли они эк- 
вивалентными без учета регистра символов. До версии у5.16 функция їс была 
доступна в модуле п1соде::СазеРо19 из архива СРАМ. 


Загляните в свою копию страницы регіѓипс справочного руководства и примеча- 
ния к выпуску версии (рей 4ейа), чтобы определить, поддерживает ли ваша вер- 
сия Рей эту возможность. Если такая поддержка имеется, значит, наряду с ней 
поддерживается интерполируемая экранированная последовательность \Ё, дей- 
ствующая подобно \[ и \|, но производящая свертку регистра. 


Еще одна интересная особенность Юникода, несвойственная АЎСП, заключается 
в том, что операцин преобразования регистра может оказаться необратимой. На- 
пример, 10(°В") возвращает Ё, но ис("В”) возвращает "55", а 1с("55") — "35", что 
далеко от первоначальной формы. Но не обязательно прибегать к экзотическим 
двухсимвольным комбинациям, чтобы показать, что обратимость операции пре- 
образования регистра не гарантируется. Вспомните греческие сигмы: «0% — это 
обычная форма, а «с» -– форма, используемая в конце слов, и для обеих форм име- 
ется единственная форма в верхнем регистре, «>». Если выполните преобразова- 
ние 1с(0с("с`)), результат будет отличаться от первоначального значения «$» — вы 
получите символ «0». 


Однако не все символы, имеющие регистр, способны изменять его. В Юникоде 
символ не обязан иметь верхний или заглавный регистр лишь потому, что он 
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имеет нижний регистр. Например, ис("МКіп1еу") вернет “МКТМЕУ", потому что 
СИМВОЛ МОПТЕТЕВ ТЕТТЕВ $МАІ1, С имеет нижний регистр, но не имеет других регист- 
ров, иначе он выглядел бы неправильно. Аналогично капитель, фактически, 
представлена символами нижнего регистра, потому что по высоте они соответст- 
вуют строчным буквам. В строке «ВоптрЕв САМЕВА» первая буква каждого слова 
находится в верхнем регистре, а остальные - в нижнем. 


Не все символы, имеющие нижний регистр, являются буквами. Регистр — это 
свойство, не зависящее от принадлежности к той или иной категории. Римские 
цифры, например, имеют регистр, сравните «УШ» и «уііі». Существуют даже бу- 
квы, считающиеся буквами нижнего регистра, для которых выполняется равен- 
ство 66-і п и не выполняется 00=11. 


В случае АЅСП, чтобы перевести слово в регистр «заголовка», используется функ- 
ция исѓігѕї(1с($5)), которая, однако, не гарантирует корректную работу с Юнико- 
дом, потому что перевод в заглавный регистр из нижнего регистра не всегда дает 
тот же результат, что и перевод в заглавный регистр оригинала. Это замечание 
верно и для других комбинаций. Правильный способ состоит в том, чтобы первую 
букву отдельно перевести в заглавный регистр, а остальные – в нижний, либо яв- 
но вызвав соответствующие функции, либо с помощью операции подстановки: 


Фес = исѓігеї(ѕибѕїг ($5, 0, 1)) 10с(50051г($5, 1)); 


$/(\м) (\м* )/\и$ 11 $2/0; 


Помимо основных категорий (Сепега! Саёерогіеѕ) в Юникоде имеется довольно 
много категорий, связанных с регистром символов. В табл. 6.3 перечислены кате 
гории, поддерживаемые Юникодом версии уб.0. Все они являются логическими 
свойствами, поэтому допускается использовать форму записи с одним элементом. 
Иначе говоря, для проверки наличия свойства в любом кодовом пункте вместо 
\ріСиСМ=үеѕ} и \р{СИСМ=№} можно использовать форму записи \р{СИСМ} и \Р{СИСМ}, со- 
ответственно. 


Таблица 6.3. Свойства, связанные с регистром 


Саѕеа 


Гомег Гомегсазе 

Те ТіїЙесаѕе 

Оррег Оррегсаѕе 

СУТЬ Сһапееѕ Мһеп Г.омегсаѕеа 

СМТ Сһапсеѕ Мһеп Тіесаѕеа 

СҰО СҺапсеѕ Мһеп Оррегсаѕеа 
С\МУСМ Сһапееѕ Мһеп Саѕетарреа 
СУСЕ Сһапееѕ Ұһеп Саѕеғѓоіаеа 
СУУКСЕ Сһапееѕ Мһеп МЕКС Саѕеѓоідеа 
СІ Сазе_Тепогае 


Зой_Пойеа 
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Свойства [омег и Џррег соответствуют всем кодам символов, обладающих соответ- 
ствующими свойствами, не только буквам. В настоящее время не существӯет не- 
буквенных символов, имеющие заглавный регистр, поэтому Тії1е (пока) суть то 
же самое, что и 9с=1ї. Однако в области действия модификатора /1 все три свойст- 
ва соответствуют свойству Сазед, которым обладают не только буквы. При поиске 
без учета регистра символов эквивалентом 9с={{ является свойство Сазе_1е\Тег. 
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Выше уже упоминались символы, такие как ГАТТМ БМА, ГЕТТЕВ 07, которые пред- 
ставлены одним кодом, но выглядят как два символа. Однако гораздо чаще встре- 
чается противоположная ситуация. То есть, для отображения одиночного симво- 
ла (графемы) может потребоваться более одного кода. Представьте букву с диак- 
ритическим знаком (или парой знаков), скажем, «6» в слове «гё6зитеё». Каждая 
такая буква может обозначаться одним кодом или двумя. Может даже так слу- 
читься, что одна буква «ё» в слове будет обозначена единственным кодом буквы, 
а другая — кодом буквы, за которым следует код диакритического знака. Глядя 
только на изображения символов, невозможно заметить разницу, потому что они 
считаются эквивалентными. Эта тонкость имеет серьезные последствия для об- 
работке практически любого текста, и она почти противоречит тому, что говори- 
лось выше о неважности начертаний. В данном конкретном смысле начертания 
приобретают особую важность. 


Комбинационные символы используются, например, для превращения «п» в «0», 
«с» —В «с», «О» — В «ӧ» ИЛИ «и» — в «і». В первых трех случаях требуется по одному 
комбинационному знаку, а в последнем - два. На практике количество комбина- 
ционных знаков не ограничивается. Вы можете добавить любое их количество, 
и в результате создать символы, прежде никем не виданные. 


Все это требует серьезного переосмысления и переделки самого разнообразного 
программного обеспечения. Только представьте, какие функции возлагаются на 
систему управления шрифтами. (Нет, отказ не принимается.) Возможно, ваши 
собственные программы обработки текста нуждаются в серьезной переделке. Да- 
же такие простые понятия, как перестановка символов строки в обратном поряд- 
ке, становится большой проблемой, ведь если переупорядочивать коды, а не гра- 
фемы, комбинационные знаки окажутся присоединены к другим базовым симво- 
лам. Мо, Мана и Егапсо превратятся в этом случае в оп!М, аігаМ и ѕіоспагеЕ. 


Рассмотрим графему, сконструированную на базе алфавитного кода, А. за кото- 
рым следуют два комбинационных знака, назовем их Х и У. Имеет ли значение 
порядок, в котором они применяются? Являются ли графемы АХУ и АУХ одним 
и тем же символом? Иногда да, иногда нет. В таких графемах, как «0», порядок не 
имеет значения, поскольку один знак располагается над символом, а второй — 
под ним. Так как порядок не имеет значения, программа должна считать эту гра- 
фему за символ гАтІМ ГЕТТЕВ МАШ. О, за которым следуют, в любом порядке, знаки 
СОМВІМІМС ОСОМЕК И СОМВІМІМС МАСКОМ. Но иногда оба комбинационных знака распо- 
лагаются в одной и той же области символа. и тогда порядок имеет значение. 
Подробнее об этом чуть ниже. 


Но и этим наши мучения не заканчиваются. Юникод содержит предварительно 
скомпонованные символы, назначение которых – обеспечивать двунаправленную 
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совместимость с устаревшими наборами символов. Например, алфавит [аір на- 
считывает порядка 500 таких символов,алфавит Стеек — около 250. Подобные 
символы во множестве существуют и в других алфавитах. 


Например, символу «6» соответствует код 0+00Е9, т.Ат1м ІЕТТЕЕ ЗМАШ, Е МТН АСОТЕ. 
Да, всего один. А сложность вот в чем: обращаться с ним следует так же, как если 
бы графеме соответствовал код гАТІМ ІЕТТЕЕ $МАЫ, Е, за которым следует сомвіміМС 
АСОТЕ АССЕМТ. 


Для графем, включающих более одного комбинационного знака, количество ва- 
риантов представления еще больше, так как некоторые из них могут начинаться 
с того или иного предварительно скомпонованного символа, уже имеющего встро- 
енный комбинационный знак, за которым следует еще один комбинационный 
знак. 


Чтобы управиться со всем этим многообразием, Юникод вводит конкретную про- 
цедуру нормализации. Согласно глоссарию Юникода по адресу һїїр: //ипісоде.ого/ 
91о$загу/, нормализация - это «устранение из текстовых данных альтернативных 
представлений эквивалентных последовательностей и преобразование их в фор- 
мы, эквивалентность которых может быть установлена на двоичном уровне». 
Иными словами, нормализация позволяет обеспечить уникальную идентифика- 
цию для каждой семантической единицы, благодаря чему устраняется связь 
«один-ко-многим». 


Ниже перечислены четыре формы нормализации в Юникоде: 


• форма нормализации О (МогтаП тают РЕогт О, МЕО), получаемая в результа- 
те канонической декомпозиции; 


» форма нормализации С (МогтаПтайоп Гогт С, МЕС), получаемая в результате 
канонической декомпозиции, за которой следует каноническая композиция; 


• форма нормализации КР (МогтаНтаНоп Еогт КО. МЕКО). получаемая в ре- 
зультате совместимой декомпозиции; 


• форма нормализации КС (МогтаН2аНоп Еогт КС, МЕКС), получаемая в ре- 
зультате совместимой декомпозиции, за которой следует каноническая ком- 
позиция. 


Обычно предпочтение отдается каноническим формам, потому что при нормали- 
зации в совместимые формы может теряться часть информации. Например, 
МЕКО("""") вернет обычную двухсимвольную строку ТМ“. Это может быть жела- 
тельно для организации поиска и подобных операций, но каноническая декомпо- 
зиция для большинства ситуаций обычно дает более приемлемые результаты, 
чем совместимая декомпозиция. 


Если не выполнить нормализацию самостоятельно, строка в программе необяза- 
тельно будет иметь форму МЕР” или МЕС; строки могут существовать в ненорма- 
лизованном виде. Рассмотрим в качестве примера символ «б», который является 
всего лишь строчной латинской буквой «0» с тильдой и знаком долготы над ней 
(в противоположность знаку долготы с тильдой над ним). Данная графема может 
быть представлена различным числом кодов, от одного до трех, в зависимости от 
формы: "\х{220}" ~ в МЕС, "\х{6Е}\х{303}\х{304}" — в МЕР, и "\ж{Р5}\х{304}" – без нор- 
мализации. В табл. 6.4 перечислено семь вариантов строчной латинской буквы 
«о» с тильдой и в некоторых случаях со знаком долготы. 
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Таблица 6.4. Каноническая головоломка 


№ п/п | Начертание | МЕС? | МЕО? | Литерал Кодовые пункты 


1 \Ж{ЕБ}” Т.АТІМ ЗМАТЛ, ГЕТТЕВ О УЛТН ТПОЕ 
2 70\х{303)}” Т.АТИМ МАГ, ГЕТТЕВ О, СОМВІМІМС ТП.рЕ 


$ "\х{220}" ТААТІМ 8М АТЛ, ТЕТТЕВ О МІТН ТНОЕ АМР 
МАСВОМ 


4 "\х{Е5}\х{304}” | АТТМ $МАТЕ, ГЕТТЕВ О МТН ТПрЕ, 
СОМВІМІМС МАСКОМ 


5 70\х{303}\х{304}" | АТМ МАТ, ГЕТТЕВ О, СОМВІМІМС ТІРЕ, 
СОМВІМІМС МАСКОМ 


6 - 70\х{304}\х{303}" | тАТИХ ЗМАГЛ, ГЕТТЕВ О, СОМВІМІМС 
МАСВОМ, СОМВІМІМС ТПОЕ 


Ч "\х{140}\х{303}” | АТИ МАТА, ТЕТТЕВ О УІТН МАСВОМ, 
СОМВІМІМС ТНОЕ 


В языке Рей за функции нормализации отвечает стандартный модуль Џпісойе:: 
№гта117е. Как правило, весь текст Юникода, получаемый извне, желательно сна- 
чала пропускать через процедуру нормализации МЕР, а весь текст Юникода, ко- 
торый выводится вовне, – через процедуру МЕС, как показано ниже: 


иѕе %5. 14; 
иѕе 5їгісї; 
иѕе магпіпоѕ; 
иѕе магпіпоѕ РАТА => "иї#8", # возбуждать исключения, 
# связанные с ошибками кодирования 
иѕе ореп ам(:39 :иїт8): 


изе Шп1соде: : Могта112е ам(МЕО МС); 


мһі1е (ту $1іпе = <>) { 
$1іпе = М№Е0($1іпе); 


} сопёіпие { 
рип МЕС($1іпе), 
} 


Этот фрагмент читает текст в кодировке ОТЕ-8 и автоматически декодирует его, 
возбуждая исключения при обнаружении ошибок кодирования. Первое, что де- 
лается в цикле — выполняется нормализация входной строки в форму канониче- 
ской декомпозиции. Иными словами, все предварительно скомпонованные сим- 
волы разбиваются на составляющие, к неописуемой радости редукционистов. 
При этом также переупорядочиваются все знаки, присоединяемые к разным час- 
тям базового кода!. 


Без нормализации вы не сможете даже подступиться к решению проблемы, свя- 
занной с комбинационными знаками. Рассмотрим графемы, представленные 
в табл. 6.4. 


1 Если заумствовать, то следует сказать «согласно их каноническим комбинационным 


классам». 
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• Номер 4 – это ненормализованная графема. Такое иногда случается. 


• Если предположить, что вы выполняете нормализацию МЕР, графема 1 пре- 
вратится в графему 2, Зи 4 превратятся в графему 5, а графема 7 превратится 
в графему 6. 

• Если предположить, что вы выполняете нормализацию МЕС, графема 2 пре- 
вратится в графему 1, 4 и 5 превратятся в графему 3, а графема 6 превратится 
в графему 7. 

» Это означает, что путем нормализации в любую форму, МЕО или МЕС, можно 
обеспечить возможность сравнения графем 1—2, 3—5 и 6-7 посредством просто- 
го оператора ед. 


» Однако, обратите внимание, что это три разных набора. Ӛ 


Одна приятная новость состоит в том, что шаблоны Регі предлагают отличную 
поддержку графем, главное знать, как ею пользоваться. Метасимволу \Х в регу- 
лярных выражениях соответствует единственный, видимый пользователем, 
символ, который на языке Юникода называется групповой грифемойл 


Большинство групповых графем (но не все) состоит из базового кода и нуля или 
более комбинационных кодов. Одной широко распространенной двухсимвольной 
графемой, не имеющей комбинационных знаков, является “\г\п", которая обыч- 
но называется СВГЕ. Метасимвол \Х соответствует комбинации СКІЕ как единой 
групповой графеме, потому что с точки зрения пользователя это единственный 
символ. В алфавите Јарапеѕе также имеются две расширенные графемы, не со- 
держащие комбинационных знаков, НАГЕУЛОТН КАТАКАМА УОІСЕ” 500МР” МАЕК И НАІЕ- 
УПОТН КАТАКАМА ЅЕМІ-УОІСЕР 500Мр МАЕК. 


Но обычно групповую графему можно представлять себе, как базовый символ 
(\р{бгарпете_Вазе}) с произвольным количеством комбинационных знаков, селек- 
торов вариантов, японских огласовок, соединительных знаков нулевой ширины, 
а также несоединительных знаков (\р{Сгарпете_Ехтепа}*), следующих непосредст- 
венно за ним. Исключение составляет пара СВГЕ. 


Фактически групповые графемы можно считать обычными графемами.? 


Метасимвол \Х в операциях поиска по шаблону соответствует любой из семи гра- 
фем, представленных выше, и даже не требует приведения их к канонической 
форме. Хорошо, и что дальше? А вот с этого места начинаются сложности. Если 
вам потребуется знать о графеме больше, чем то, что она является графемой, вам 
придется проявить умеренную сообразительность при реализации поиска по 
шаблону. Приведение к МЕР - условие необходимое и достаточное, чтобы: 


• /70/ сообщал, что все семь графем начинаются символом «0»; 


е /о\МСОМВІМІМО ТИОЕ}/ сообщал, что графемы 1—5 начинаются с символа «0» 
и тильды, но пропускал графемы би 7; 


• Найти все семь графем. Придется использовать /^о\р№М»?\МСОМВІМІМО ТІГ0Е)/. 


Строго говоря, метасимволу \Х соответствует то, что в стандарте Юникода описывает- 
ся, как расширенная групповая графема. Очевидно, разработчикам стандартов платят 
за количество слов. 


Именно это мы и делаем. Нам не платят за количество слов. 
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А вот попытка решить вопрос поиска полного символа, оставляющая за кадром 
такие тонкости, как использование \р{бгарпеше_Ех{епта} вместо \рМ, а также 
\р{бгарпете_Вазе} (если уместно) вместо \РМ: 


$0_1119е_гх = дг{ о \рМ х? \ж{СОМВТАТМЮ ТТЬОЕ} \рм* }х; 


Гораздо более простой подход к сравнению строк (без учета диакритических зна- 
ков) приводится в следующем разделе, «Сравнение и сортировка строк Юникода». 


Метасимвол \Х — единственный в ядре Регі, знающий о существовании графем. 
Встроенные функции, такие как ѕибѕїг, 1епоїћ, 1пдех, гіпаех и роѕ манипулируют 
кодами символов, а не графемами. Поэтому \Х – это вап" молоток. С ним весь на- 
бор Юникода начинает напоминать гвозди. Огромное количество гвоздей. 


Представьте, что вам потребовалось обратить порядок следования кодов симво- 
лов в строке «сгётпе г Ш6е». Если предположить, что строка нормализована в фор- 
му МЕР, вы получили бы в результате «веть ећегс», тогда как в действительно- 
сти требуется получить «еёйгЬ етёгс». Вместо этого следует с помощью \Х извлечь 
список графем и переупорядочить их. 


иѕе уо. 14; 

оиѕе иї#8; 

пу $с6 = “сгёте оги1ее”; 

пу $6с = јоіп("" => геуегзе($с6 =- /\Х/9)); 
зау $0с; и “её1Ого етёгс” 


Предположим, что переменная $с) ниже всегда содержит строку «сгёте ге», 
сравним операции над кодами и операции над графемами: 


ту Фсһаг_Іепоїһ = 1епоїһ(%с); # 15 или 12 
пу $дгарһ_соџпі = 0; 
фогарһ_соџпё++ мћі1е $ср =- /\Х/д; # 12 


Извлечь первую часть можно было бы, как показано ниже: 


пу Ф$ріесе = ѕирѕЕг($с0б, 0, 5), # “сгёт” или “сгёте“ 
ту($ріесе) = $с6 =- /(\Х{5})/; # "сгете” 


А изменить последнюю часть следующим образом: 


ѕирѕіг($с0, -6) = “Ғгаісһће”; # "сгете БгРгасве” или “сгёте Ғгаїсһће” 
фсб =- 5/\х{6}%/#гаїсһе/; # “сгёте ёгаїсһе 


И вставить «Ыеп»: 


ѕирѕіг($с0, 5, 0) = ” Шеп”; # "сгеп блепе бг01ёе” или “сгеме біеп бго16ёе” 
фср =- з/^\Х{5}\К/ біеп/ н "сгёте біеп 6го1ее” 


Обратите внимание, насколько нестабилен подход, основанный на кодах. В ком- 
ментариях первый ответ соответствует строкам в МЕР”, а второй – строкам в МЕС. 
Может показаться, что приведение строк к МЕС решит все проблемы, но это не 
так. С одной стороны, графем, не имеющих предварительно скомпонованных 
знаков, бесконечно больше, чем графем, имеющих такие знаки, поэтому приведе- 
ние к форме МЕС не гарантирует избавление от комбинационных знаков. 


Кроме того, форма МЕС в действительности сложнее в использовании, поэтому 
мы рекомендуем всегда приводить входящие данные к форме МЕР. Взгляните, 
как можно было бы выделить слова с двумя «е», такие как «стёте» и «Бг6е». Про- 
стейший и самый надежный способ: 
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[е .*‹? е /х 


будет работать только со строками, нормализованными в форму МЕБ, а не МЕС. 
А если вы думаете, что, используя форму МЕС, можно гарантировать то же самое, 
записав: 


/ [еёё] .*? [её] /х 


то быстро поймете, что ошиблись, столкнувшись со словом «сгёреѕ». Добавление 
одного «ё» как будто решает проблему, но таким путем вы очень скоро придете 
к совершенно сумасшедшему шаблону: 


/ [ёёёёёёевееё] [ёёёёёёёеееё] /х # два символа е в строке 


который также окажется неработоспособным, если кто-то подсунет ему «е» с под- 
черкиванием, поскольку этот символ не имеет предварительно скомпонованной 
графемы. Если (и только если) ваши строки будут приведены к форме МЕР, сле- 
дующий шаблон будет работать всегда: 


/ (2: (?=е) \Х ){2} /х 


Это решение обеспечивает надежный и неразрушающий способ сопоставления 
без учета акцентов: используйте метасимвол \Х, соответствующий графеме, и вве- 
дите ограничение, требующее, чтобы графєма начиналась с искомого базового 
символа. Единственное, чего нельзя добиться таким способом – реализовать по- 
иск в строках, приведенных к форме МЕР (или МЕКО), букв, которые не поддают- 
ся декомпозиции, потому что они считаются самостоятельными буквами. 


Например, таким способом нельзя отыскать все символы +0» в слове «;тоггеога4», 
потому ЧТО АТМ МАП, ГЕТТЕК О УЛТН ЗТВОКЕ Не имеет составного представления, где 
символ «о» был бы выделен из графемы. В имени «хаг Агпбогд Вјагтаѕоп» вы 
сможете отыскать все буквы «о» после декомпозиции, но не сможете отыскать 
символы «е» и «4», потому что ІАТІМ САРГТАТ, ГЕТТЕК АЕ не разбивается на «а» и че», 
атАТІМ МАЦ. ТЕТТЕЕ ЕТН не превращается в «д». 


Во всяком случае, при использовании декомпозиции. Однако сравнение с помо- 
щью специализированного объекта из \11с062`:Сс-1а-е позволило бы отыскать все 
три символа. В следующем разделе, «Сравнение и сортировка строк Юникода», 
мы покажем, как это делается. 


Необходимость использовать метасимвол \Х каждый раз, когда возникает по- 
требность в использовании встроенных строковых функций, выглядит несколь- 
ко странной. Альтернативное решение заключается в использовании модуля 
Џпісоде::6С51гіпо из СРАМ. 


Обычные строки в Регі всегда интерпретируются как последовательности кодов, 
но этот объектно-ориентированный модуль позволяет работать со строками, как 
с последовательностями групповых графем Юникода. Ниже показано, как мож- 
но использовать методы из этого модуля для выполнения обсуждавшихся выше 
операций над последовательностями графем: 


пу $95 = Џпісоде: :605їгіпо("сгете бг01ёе”); 


зау $05->1епоїн(); 

ѕау $9$->зи6$1г(0,5); 
ф95->ѕибѕіг(-6, 6, "Ғгаїсһе"); 
$95->ѕибѕіг( 5, 0, “ біеп”); 
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Теперь выбор формы нормализации не имеет значения, потому что метод Іеподїћ 
возвращает ответ в графемах, метод ѕибѕїг оперирует графемами, и можно даже 
использовать методы іпаех и глпдех для поиска литеральных подстрок, получая 
целочисленное смещение в графемах, а не в кодах символов. 


Пожалуй, самый полезный метод в этом модуле — это метод со1итпз. Представьте, 
что необходимо вывести несколько элементов меню, как показано ниже: 


сгепе бгй1ёе 5.00 
ігіғ1е 54.00 
їоЁғее 1се сгеат 54.00 


Как обеспечить выравнивание цен по вертикали? Даже если предположить, что 
вывод осуществляется с использованием моноширинного шрифта, следующее ре- 
шение не поможет: 


ритпт{("%-25$ 5%.2Р\п”, фітет, $ргісе); 


потому что Рей предполагает, что каждый код занимает ровно одну позицию 
в строке, что на практике не так. 


Метод со1итп$ возвращает количество позиций, которые займет строка при выво- 
де. Часто это число совпадает с количеством графем в строке, но не всегда. Неко- 
торые символы Юникода считаются «широкими», в том смысле, что при выводе 
они занимают две позиции. Это настолько типично для символов восточноазиат- 
ских алфавитов, что в Юникоде существуют специальные свойства Еа${_Аз1ап_ 
Міатһ=міде и Еаѕї Аѕіап_ Міатһ=Еи11, которые указывают, что символ занимает две 
позиции при выводе. 


Некоторые символы вообще не занимают позиции при выводе, и не только пото- 
му, что они являются комбинационными знаками: это могут быть символы 
управления или форматирования. Плюс ко всему к этому, некоторые комбинаци- 
онные знаки занимают отдельную позицию при выводе. Единственное, на что во- 
обще можно положиться при использовании моноширинного шрифта, это то, что 
размер каждого символа будет кратен ширине одной позиции. 


Ниже демонстрируется одно из возможных решений дополнения строки до опре- 
деленной длины: 


зир раа { 

ту($5, $мібїһ) = ё ; 

пу $08 = Џпісоде: :©С51гіпо->пем($5), 

геїигп $905 (" “х (фиат - $05->со10тпѕ)); 
} 


ритпЕЕ( "$ 20. 2#\п", раа($ітет, 25), $ргісе); 


Теперь ваши строки выравняются по вертикали, даже если будут содержать фор- 
матирующие символы, комбинационные знаки или широкиє символы. 


Несмотря на всю свою привлекательность, модуль Џпісоде::0С51гіпо в действитель- 
ности является всего лишь вспомогательным модулем для другого, более крупно- 
го модуля, который решает более сложную проблему: модуля ()п1сойе: :1 іпеВгеак 
из СРАМ. Последний реализует алгоритм разбиения строк (Опісоде іпе Вгеакшй 
Аієогіі), описываемый в ОАХ# М, приложении к стандарту Юникода. Он мо- 
жет пригодиться вам, когда потребуется разбить текст Юникода на абзацы, как 
это делает программа ОМ№ІХ ўт (1) из модуля Техї::Аџїоѓогпаї. В качестве примера 
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можно предложить программу ип тё из модуля Ип1соде: Тиѕѕ1е. Она все делает пра- 
вильно, даже столкнувшись с восточновзиатскими широкими символами, табуля- 
циями, комбинационными символами и невидимыми кодами форматирования. 


Сравнение и сортировка строк Юникода 


Встроенные функции $01 и стр не сравнивают строки по алфавитному признаку. 
Вместо этого сравниваются числовые значения кодов символов в одной строке 
с числовыми значениями кодов соответствующих символов в другой строке. Та- 
кой подход плохо работает с текстом, где наряду с символами, общими для раз- 
ных языков, встречаются символы, характерные для каждого отдельно взятого 
языка. Это связано не только с наличием кодов, числовые значения которых не 
совпадают с алфавитным порядком, – числа и другие последовательности также 
могут вносить беспорядок, из-за того, что некоторые были добавлены в наборы 
символов, когда они были еще маленькими, а другие — когда наборы символов 
имели уже приличный размер, как Торзу. Например, символы показателей сте- 
пеней 2 и 3 появились в Гай п-1 на ранних этапах его становления. Поэтому, кста- 
ти, при сортировке они располагаются первыми: 


изе 5.14; 

иѕе иЁ#8, 

пу @ехе$ = дм( х! хо х х3 хб х5 х х? х9 х! ) 
@ехе$ = ѕогі @ехеѕ; 

ѕау "бехеѕ”; 


# выведет: х2 х х! ҳо х* хз хе х! х8 хз 


Поскольку числовые значения кодов не соответствуют алфавитному порядку сле- 
дования символов, строки будут сортироваться в порядке, который, не будучи со- 
всем уж случайным, не соответствует ожиданиям пользователей. Функция ѕогї 
хороша в основном для быстрого упорядочивания, когда порядок следования все- 
гда будет одним и тем же, пусть и не совпадающим с алфавитным. Иногда этого 
вполне достаточно, но иногда... 


Представляем стандартный модуль ипісойе::С011аїе, который реализует алгоритм 
упорядочивания Юникода (Опісоде СоНайоп А]еогИи бт, ОСА), обладает широки- 
ми возможностями настройки и обеспечивает многоуровневую сортировку Юни- 
кода. Модуль обладает большим количеством замысловатых особенностей, но 
часто его применение ограничивается вызовом его метода ѕ50гї без дополнитель- 
ных параметров: 


изе У5. 14; 

изе иЕғ8; 

иѕе Џпісоде: :Со11аїе; 

ту @ехеѕ = ди( х! х0 хё х? х6 х5 х х? х х! ); 
@ехез = Џпісоде: : Со11аїе->пем->ѕогї(@ехеѕ); 
ѕау "@ехеѕ"; 


# выведет: х0 х! х2 хз х* х? хе х’ х8 х9 


По умолчанию модуль обеспечивает алфавитно-цифровую сортировку. В первом 
приближении, его принцип действия выглядит так: из текста удаляются все не- 
алфавитноцифровые символы, после чего оставшееся сортируется без учета реги- 
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стра символов, не в числовом порядке кодов, а в порядке следования в алфавите. 
Такого рода сортировка используется в словарях, именно поэтому она иногда на- 
зывается словарной, или лексикографической сортировкой. 


Прежде чем люди привыкли пользоваться компьютерами, не умеющими пра- 
вильно сортировать текст, именно такой порядок сортировки считался (и по сей 
день зачастую считается) верным. Название книги с запятой после первого слова 
в перечне названий должно располагаться рядом с таким же названием, не содер- 
жащим запятой. Запятые не должны оказывать влияния на сортировку, по край- 
ней мере, когда этого не требуется. Запятые не являются естественной частью ал- 
фавитного порядка, как буквы и цифры. 


Взгляните, какие результаты дает встроенная функция ѕогї (которая сортирует 
строки так же, как аналогичная команда, имеющаяся в оболочке интерпретато- 
ра команд и в большинстве языков программирования): 


Х рег1 -е "ргіпі зогЕ <>’ 11+ї11е-гейѕ 
СЯ е Вед Миѕһгоотѕ 

Не Нед Вібіпо Нооа 

Ее Веб Тепе 

ііїтт1е Нед, Моге В1џе 

іі++1е, Вед Відег 


Что за ерунда? Слово «Моге» должно предшествовать словам «Миѕһгоотз», слова 
«В14ег» и «Бійіпе» должны располагаться рядом, а слово «Тепё» должно оказать- 
ся в конце. Даже с точки зрения АЗСП это не алфавитный порядок; вот алфавит- 
ный порядок: 


Х рег1 -Мупісоде: : Со11ате -е 
ргіпе Рог Џпісоде: : Со11а+е->пем->ѕогї(<>)` 11її1е-гейѕ 
ТЕ е Ңед, Моге В1ие 
НЕЕе Кед Миѕһгоотѕ 
Ее, Вед Відег 
Не Аед Відіпо Ноод 
ее Аед Тепе 


Нам кажется, что вам понравятся результаты этой сортировки Юникода настоль- 
ко, что вы захотите сохранить этот маленький сценарий на случай, когда потре- 
буется сортировка обычного текста. Он предполагает, что исходный текст имеет 
кодировку ОТЕ-8, и производит вывод тоже в кодировке ОТЕ-8: 


#1 /иѕг/біп/рег1 

иѕе магпіпоѕ; 

иѕе ореп дм(:3Е9 94178); 

иѕе магпіпоѕ ам(РАТАЕ оЁЁ8); 

иѕе Џпісоде: :Со11аїе; 

ргіпї Рог Уп1соде: : Со11аіе->пем->5огї( <>). 


Более разносторонний вариант этого сценария доступен в виде программы исзогф, 
входящей в комплект /пісоде: 10$51е из архива СРАМ. 


Большинство людей считает, что с настройками по умолчанию модуль позволяет 
добиться вполне приемлемых результатов. Он уже знает, как сортировать буквы 
и числа, плюс умеет обращаться со всеми странностями Юникода, противореча- 
щими АБСП-сортировке, как например упорядочение символов, которые соглас- 
но числовому порядку следования кодов оказываются далеко друг от друга, но 


308 Глава 6. Юникод 


при сортировке должны оказываться рядом, учитывает все замысловатые прави- 
ла Юникода, касающиеся регистра символов, принимает во внимание канониче- 
ские эквиваленты строк и многое другое. 


Плюс, если у вас имеются собственные предпочтения, модуль обладает практиче- 
ски неограниченным потенциалом настройки. Ниже демонстрируется неслож- 
ная настройка, которая пригодится при сортировке названий книг и фильмов на 
английском языке. На этот раз символы верхнего регистра предшествуют симво- 
лам нижнего регистра, перед сортировкой удаляются ведущие артикли и добав- 
ляются ведущие нули в числах, благодаря чему название «101 раітаѓіопѕ» ока- 
зывается в списке ниже, чем «7 Вгійеѕ ог 7 Вго{Тегз».! 


ту $с011афог = Уп1соде: :Со11 афе->пем( 
иррег_Бегоге_1омег => 1, 
ргергосеѕѕ => ѕир { 
1оса1 $ = $1111; 


5/7 (?: Тһе | Ап? ) \п+ //х; # отбросить артикли 
5/ ( \а+ ) / ѕргіпЕ? "0200", $1 /хед; 
геёигп $_; 


}, 
3; 


Выше уже было показано, насколько более приемлемой выглядит алфавитная 
сортировка в сравнении с сортировкой по числовым значениям символов АЗСП. 
В Юникоде ситуация обостряется. Даже если вь используете «всего лишь» анг- 
лийский язык, вам все равно придется сталкиваться не только с символами АСП. 
Что если в ваших данных присутствует обозначение «10$» или «#5»? Даже в тек- 
сте исключительно на английском языке могут встретиться фигурные кавычки. 
замысловатые дефисы и прочие специальные символы, отсутствующие в наборе 
АЗСП. Даже если говорить исключительно о словах, которые можно найти в сло- 
варе английского языка, это не освобождает вас от необходимости предусматри- 
вать обработку особых случаев. Ниже приводится список слов из оксфордского 
словаря английского языка (Охѓога ЕпёЙзН ПО1сйопагу), отсортированных (по ко- 
лонкам) с использованием алгоритма ОСА в режиме по умолчанию: 


АПегба Ее М№іс̧оіѕе ѕтоггергба 
аргёз-5К1 ешегє ріћоп ѕоігбе 

Вокта] Нахеоги. расаве фарёпаде 

Ъгавзаеге Сӧдеіап ргёі-А-рогіег уісцћа 

саћа зайарейо Ргоуепса1 уіѕ-4-уіѕ 

сгёте МадгПепо ачіпсеаПега 7ой 

сгёре Мбыиз Варпагок а-Кеїоіѕзоуа]егіс асіа 
дёвосиугетепі Моһогоуіёіс діѕсопіїпиіёу гёѕштєё (о-)іроїс асі 
Ғарегеё тоїгє Ѕсһгӧйіпеег (В-)погпісобіпе 
Ғас̧аде паїуе 5һјо \у-іопопе 


1 Ведущие нули необходимы, потому что, несмотря на известность числовых значений 


цифровых кодовых пунктов, инструменты сортировки обычно не понимают, что число 
9 должно предшествовать числу 10, если не использовать трюк, подобный этому. 
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Едва ли кто-то предпочел бы увидеть эти слова, отсортированные в порядке 
АЅСП. Это не самое приятное зрелище. И это текст, содержащий только латин- 
ские символы. Взгляните на слова, встречающиеся в греческой мифологии, от- 
сортированные по кодам символов: 


Асс "АсђВолос̧ МбУоСос Фоутасос Метод олос 
АсђВетос Аүхістс "Еслеріс̧ Аүбіотіс Телеофорос 
Асолос еа `БопЕрос Астроїос Хросоерис 
Өрӧсос̧ Мною Ебуостос АскАбс̧ Арстобпрос 
бслс Персе0с̧ "Нфолотос "Нфолстос Аріотораҳос 
№0906 'Аброюих, Носфорос Арістойос Лолотроубуєс 
Пёрстс 'А\кпойс Ораскюс Асколофос 

Пістіс АїусӨос Пёссолос ВоросӨғміс 

Хрӧбос Арүёоттс Профосюс ‘Еоперібьс 


Даже если вы не знаете греческий алфавит, вы все равно сможете заметить, на- 
сколько сортировка по кодам не соответствует алфавитной: просто пробегите 
взглядом по первым буквам в каждом столбце. Видите, как они «прыгают» с мес- 
та на место? При сортировке с использованием алгоритма ОСА в режиме по умол- 
чанию они располагаются правильном порядке: 


Аүбіотс Асђетос "Еслерідес 1@с10$ Піст 
Аүҳістс АсВолос "Еслеріс Лолотроүбуєс Профоюс 
'Аброютос АскоЛофос "Еслерос ЛоХЕС Телвофорос 
Агуоб0с АскАтӧос Е0уосто$ Мао Ай олос Фоутасос 
А\ктстс Астройос Нфодотос Мио Хросодєрс 
Арүёсттс̧ Асолӧс "Нфолотос №0006 Хробоб 
Арістоїос ВоросӨєуіс Носфӧорос Поссоћос$ 

Арістобпџос Мӧу0сос Өроскіос Пербёс 

Аротороҳос̧ Дос Өрёсос Пёротс 


Нам удалось вас убедить? Теперь посмотрим, как в действительности работает 
алгоритм ОСА, а затем познакомимся с его настройками. 


Алгоритм Опісоде СоПайоп А]огИВт предусматривает многоуровневую сорти- 
ровку. Вы с ней уже сталкивались. Представьте теперь, что вы написали свою 
функцию сравнения для передачи в качестве функции обратного сравнения встро- 
енной в язык $0г{, и ваша функция выглядит так: 


@со11аїеа Техї = ѕогї { 
рг1тагу($а) <=> ргітагу(%0) 
Т 


ѕесопаагу($а) <=> зесопаагу($65) 


Тегііагу(фа) <=> їегїіагу($6) 
1 
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доатегпагу($а) <=> диафегпагу($6) 


} @егапдот_гехЕ; 


Это — многоуровневая сортировка. Если говорить упрощенно, именно так рабо- 
тает алгоритм ОСА. Каждая из четырех функций возвращает число, определяю- 
щее вес данного уровня. Только когда на первом уровне обнаруживается совпаде- 
ние, сравнение продолжается на втором уровне и т.д. 


Ниже приводится несколько упрощенное, но достаточно полное описание алго- 
ритма: 


Первый уровень: сравнение букв 


Проверяется равенство базовых букв. На этом уровне игнорируются все сим- 
волы, не являющиеся буквами — они просто пропускаются в процессе скани- 
рования строки. Если буквы в одних и тех же относительных позициях не сов- 
падают, это несоответствие определяет словарный порядок их следования. 


Если выполняется сортировка текста, содержащего только символы из алфа- 
вита айп, будет получен обычный алфавитный порядок «арс...», который вы 
изучали в школе, т.е. слово «Егей» будет предшествовать слову «Ёгеедот», как 
и словосочетание «Ёгее реег». Причина предшествования «Ёгее Ъеег» слову 
«Ёгеедот» состоит в том, что пятая буква в первой строке — «Ъ», а она предше- 
ствует пятой букве во второй строке – букве «4». Разобрались с механизмом ра- 
боты? Это и есть словарный порядок. Пробелы не участвуют в сортировке. 


Второй уровень: сравнение диакритических знаков 


Если все буквы совпадают, на втором этапе выполняется сравнение диакрити- 
ческих знаков (точнее, комбинационных знаков: множества диакритических 
и комбинационных знаков перекрываются, но не полностью). По умолчанию 
сопоставление диакритических знаков выполняется слева направо, но на- 
правление можно поменять на обратное, как того требуют правила француз- 
ского языка. (Классическим примером обычной сортировки по диакритиче- 
ским знакам в направлении слева направо может служить последовательность 
слов соїе < соїё < соте < сб!6, которая во французском языке, согласно прави- 
лу сортировки справа налево, должна быть отсортирована иначе: соїе ‹ оӧїе < 
соїе < соїе; два слова в середине меняются местами. Это связано с особенностя- 
ми флективной морфологии французского языка.) 


Третий уровень: сравнение регистров 


Если все буквы и диакритические знаки совпадают, далее выполняется срав- 
нение регистров символов. По умолчанию символы нижнего регистра предше- 
ствуют символам верхнего регистра, однако этот порядок можно легко изме- 
нить, добавив параметр иррег_бегоге_1омег => 1 при конструировании объекта, 
выполняющего сопоставление. 


Четвертый уровень: сравнение всего остального 


Если все буквы, диакритические знаки и регистры символов совпадают, про- 
изводится сравнение всех остальных символов, таких как знаки пунктуации, 


А также цифр и некоторых других символов, которые вы, возможно, не считаете бук- 
вами (а они таковыми являются) — просто имейте в виду, что в данном случае под бук- 
вами подразумеваются не только буквы в прямом понимании. 
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специальные и пробельные символы, которые игнорировались на предыду- 
щих уровнях. На этом уровне содержание строк учитывается полностью. 


Использование уровней — дело добровольное. Вы можете, например, задействовать 
только первый уровень, где учитываются лишь базовые буквы и больше ничего. 


Именно так выполняется сравнение строк «без учета акцентов» с использовани- 
ем метода ед объекта, реализующего сравнение. 


Нормализация не всегда действует наверняка. Например, нормализация бес- 
сильна, если вам требуется, чтобы буквы «0», «б» и «б» считались одинаковыми, 
потому что буква І АТІМ МАШ ТЕТТЕЯ 0 МТТН ЅТАОКЕ не поддается декомпозиции 
в нечто другое, начинающееся с базовой буквы «о». С другой стороны, при сравне- 
нии букв Џпісоде::Со11аїе обычно считает «0», «б» и «в» одной и той же буквой. Но 
только не в алфавитах Ѕуедіѕһ или Нипғагіап. 


Аналогично обстоят дела с буквами «д» и «д» — буква Т.АТМ 5МАІЛ ТЕТТЕВ ЕТН не под- 
дается декомпозиции в нечто другое, имеющее в составе базовую букву «0», но 
реализация алгоритма ОСА считает их одной и той же буквой. Исключение со- 
ставляет алфавит Ісеіапаіс (код «1з» региональных настроек), где «д» и «д» – со- 
вершенно разные буквы. 


Если необходимо, чтобы объект, реализующий сравнение, игнорировал регистр, 
но учитывал акценты, укажите ему на необходимость выполнять сравнение 
только на первых двух уровнях и пропускать остальные, передав конструктору 
параметр 1е\е!1 => 2. 


Вот полный синтаксис всех необязательных параметров настройки конструктора 
для версии модуля у0.81: 


$Со11аїог = Џпісоде: : Со11аїе->пем( 
ОСА _меге1оп => $0СА Мегѕіоп 
а]{егпафе => $а1їегпаїе, # псевдоним для `уагіаБ1е 
раскмагаѕ => $1еме1Митбег, # или \@1еуе1М№итбегѕ 
ептгу => $е1етепт 
Папди1_егтіпатог => $їегт реітагу меідћт 
19тогеМате => дг/$ідпогеМате/, 
ідпогеСћаг => дг/$ідпогеСпаг/, 
ідпоге_Іеуе12 => $0001, 
КатаКапа_беРоге_п1гадапа => $6001, 
1еме1 => $со11аїіопіеуеі, 
погта1іғатіоп => $погта1іғафіоп_Ғогт, 
оуеггідеС К => \ёомеггідесЈкК, 
оуеггідеНапди1 => \&омеггідеНапои1, 
ргергосеѕѕ => \ёргергосеѕѕ, 
геаггапде => \@сһагііѕтї, 
гемг1{е => \&гемгіїе, 
зирргез$ => \@сһагііѕї, 
Еаб1е => $Ғі1епапе, 
ипде#Мате => дг/фипаеғМате/, 
ипде?Сһаг => дг/фипдеёСһаг/, 
иррег_Бегоге_1омег => $6001, 
уагіар1е => $уагіар1е, 


) 


Дополнительную информацию о параметрах конструктора можно найти на стра- 
нице справочного руководства модуля. Хотя этот модуль и является частью стан- 
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дартной библиотеки Ре!|, он также доступен в архиве СРАМ. Благодаря этому 
есть возможность обновлять его независимо от ядра Рег. Версия Рег у5.14 по- 
ставляется с модулем Џпісойе::Со11аїе версии у0.73, поэтому совершенно очевидно, 
что стех пор модуль обновился. Вам не нужно устанавливать самую современную 
версию Ре!|, чтобы использовать последнюю версию модуля. Он поддерживает да- 
же такие старые версии Рец, как %5.6, и обеспечивает опережающую совмести: 
мость с последними версиями стандарта Юникода посредством аргумента конст- 
руктора ИСА_\ег$1оп. 


Использование ОСА с функцией ѕогї 


В реальной жизни встроенная функция ѕогї обычно вызывается двумя способа- 
ми: вообще без подпрограммы сравнения, либо с блоком кода в виде аргумента 
играющим роль подпрограммы сравнения. В первом случае с успехом можно ис- 
пользовать метод 50гї из модуля Џпісобе::Со11аїе, но во втором... Во втором случае 
можно воспользоваться другим методом объекта, реализующего сравнение, кото- 
рый называется деїЅогїКеу. 


Предположим, что имеется программа, использующая встроенную функцию 
ѕогі, как показано ниже: 


@ѕгесѕ = ѕогї { 
$6->{АСЕ} <=> $а->{АбЕ} 
И 
$а->{МАМЕ} стр $6->{МАМЕ} 
} @гесз; 


И вот нам пришло в голову, что текст следует отсортировать по полю МАМЕ в алфа- 
витном порядке, а не по числовым значениям кодов. Для этого достаточно просто 
попросить объект сравнения вернуть вам двоичный ключ сортировки для каж- 
дой текстовой строки, участвующей в сортировке. В отличие от обычного текста, 
если передать эти двоичные ключи оператору спр, он волшебным образом отсор- 
тирует их в требуемом вам порядке. 


Блок кода для передачи функции $0гт теперь выглядит так: 


ту $со11афог = уп1соде: : Со11ате->пем(); 
Рог ту $гес (@гесѕ) { 
фгес-> {МАМЕ _Кеу} = $со!аїог->деїЅогіКеу( $гес->{МАМЕ} ); 
} 
@5гес$ = ѕогї { 
$6->{АбЕ} <=> $а-> {АСЕ} 


1 
$а-> {МАМЕ кеу} стр $0-> {МАМЕ _Кеу} 
} @гесз; 


Конструктору можно передавать любые необязательные аргументы для достиже- 
ния желаемых результатов, включая предварительную обработку. 


Объекты, реализующие сравнение, можно также использовать для простого срав- 
нения без учета акцентов и регистра символов. В этом есть определенный смысл — 
если есть возможность упорядочивать строки, значит, есть возможность опреде- 
лять их эквивалентность при определенных настройках упорядочивания. Тоесть, 
вам остается лишь выбрать нужную семантику упорядочивания. Например, если 
установить уровень сравнения 1, сравниваться будут только буквы, без учета ре- 
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гистра символов и наличия диакритических знаков. В этом вам помогут методы 
объекта, реализующего сравнение, такие как ед, ѕибѕїг и іпаех. (Однако от норма- 
лизации придется отказаться, потому что иначе изменятся смещения кодов.) На- 
пример: 


иѕе у5. 14; 

изе иї?8; 

изе Џпісоде: :Со11ате; 

пу $Со11атог = Џпісойе: : Со11а+те->пем( 
1еме1 => 1, 
погта1іғатіоп => ипдеғ, 


); 


му $Ри11 = "баргіе1 багсіа Магдие?”; 
Тог ту $зи6 (омЁМАВ СТА]) { 
і? (пу($роз, $1еп) = $Со11атог->1п09ех( $111, $зи6)) { 
ту Фтафсн = ѕирѕг($#011, $роѕ, $1еп); 
зау "Соответствие литералу ‹$$и6> найдено в ‹$#џ11, в виде ‹ФтафсН» 


} 
Если запустить этот фрагмент, он выведет: 


Соответствие литералу ‹МАЕ; найдено в ‹баргіе1 багсіа Магдие2› в виде «Маг» 
Соответствие литералу ‹СІА› найдено в ‹бабг1е1 Сбагсіа Магдие2› в виде «‹сіа› 


Пожалуйста, не сообщайте об этом в ЦРУ (СТА). 


Сортировка с учетом региональных настроек 


Алгоритм ОСА с настройками по умолчанию с успехом справляется с текстами 
на английском и на многих других языках, включая ирландско-гэльский. индо- 
незийский, итальянский, грузинский, голландский, португальский и немецкий 
(за исключением телефонных книг). Однако для алфавитной (или не алфавит- 
ной –· кому как вздумается) сортировки текстов на многих других языках требу- 
ется применить дополнительные настройки. 


Например, в скандинавских языках буквы с диакритическими знаками при сор- 
тировке должны следовать за буквой «2», а не располагаться рядом с похожими. 
Даже в испанском языке есть свои особенности: буква «п» не считается обычной 
буквой «п» с тильдой, как буквы «4» и «б» в португальском языке. В испанском 
алфавите это самостоятельная буква (и называется она, конечно, епе), которая 
должна следовать за буквой «п» и предшествовать букве «0». Из этого следует, что 
следующиеслова должны сортироваться в таком порядке: гааіо, газа, гапипсиіо, 
гапа, гаріао, гаѕігШо. Обратите внимание, что слово гапипс!о должно идти перед 
словом гапа, а не после него. 


Учесть национальные особенности сортировки текста Юникода позволяет мо- 
дуль Џпісобе: :Со11а{е: :І оса1е. Он распространяется в составе пісоде::Со11аїе и по- 
тому входит в состав Рей версии у5.14, а также устанавливается вместе с основ- 
ным модулем при установке из СРАМ. 


Единственное отличие в АРІ этих двух модулей заключается в наличии у конст- 
руктора из Ип1соде::Со11а{е: :10са]1е дополнительного параметра: регионального 
кода. На момент написания этих строк поддерживалось 70 различных регио- 
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нальных кодов, включая такие варианты, как немецкие телефонные книги (глас- 
ные с умляутами сортируются, как если бы они были обычными гласными, за 
которыми следует буква «е»), традиционный испанский («сћ» и «1» считаются 
отдельными графемами со своим местоположением в алфавите), японский, и пять 
различных способов сортировки текста на китайском языке. 


Пользоваться этим дополнительным параметром в действительности очень просто: 


изе Ип1соде: :Со11аїе: : 1оса]1е; 
$с011 = Џпісойе: :Со1Тате: : 1оса1е->пем(1оса1е => “г”); 


@ғҒгепсһ_Техі = $с011->ѕогї(@Ғгепсһ_їехї), 


Поскольку Џпісойе::С011аїе::іоса1е является подклассом, наследующим Џпісойе:: 
Соате, его конструктор принимает те же дополнительные аргументы, что и кон- 
структор родительского класса, и объекты этого класса поддерживают те же ме- 
тоды, поэтому вы можете использовать их для организации поиска с учетом ре- 
гиональных особенностей, как было показано выше. Ниже демонстрируется при- 
мер выбора настроек сортировки, используемой в немецких телефонных книгах, 
где (к примеру) «ае» и «й» считаются одной и той же буквой. Можно просто вы: 
полнить непосредственное сравнение 


эТате $с011 = пем Џпісоде: :Со11аїе: :1 оса1е:: 
1оса1е => "де_ _рпопебоок”. 


іЁ ($со11->ед($а, $6)) { .. } 
Или выполнить поиск: 


иѕе Шпісоде: :Со11аїе: :іоса1е: 

пу $С011аїог = пем Џпісоде: :Со11аїе :1оса1е: 
1оса1е => “де_ _рпопебоок” 
1еуе1 => 1, 
погта1іғаїіоп => ипде+ 


ту $011 = "Тов тов Рег1 ѕї0діегеп 
пу $500 = “МЏЕЅ5”; 
1Ғ (ту ($роз, $1еп) = $Со11аёог->іпдех($%#и11, $50и6)) { 
ту Фтаёсһ = зи6$г($Ри11, $роѕ, $1еп); 
ѕау “Соответствие литералу ‹$ѕиб› найдено в ‹$Ри11› в виде ‹Фтаїсћ›" 


} 
Если запустить этот фрагмент. он выведет: 


Соответствие литералу ‹МЏЕ$5› найдено в «‹Ісһ тиб Рег1 ѕіџйіегеп. › в виде ‹туВ» 


Дополнительные возможности 


Всегда следует помнить, что такие сокращенные обозначения символьных клас- 
сов в Рен, как \м, \5 и даже \, по умолчанию соответствуют многим символам 
Юникода, что диктуется определенными свойствами символов. Они перечислены 
в табл. 5.11 и отвечают формальным определениям из приложения «Аппех С: 
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СотраНь ИЩУ Ргорегіћеѕ» к техническому стандарту Юникода «Ошсоде Тесһпіса1 
Ѕёапдага #18, Опісоде Веяцаг Ехргезз1оп$», версии 13, выпущенной в августе 
2008. 


Если вы привыкли в своих программах извлекать целые числа при помощи выра- 
жения (\0+), этот подход не всегда будет работать корректно с данными в Юнико- 
де. По версии уб.0 стандарта Юникода, метасимволу \д соответствует 420 кодо- 
вых пунктов. Если вам это не подходит, используйте /\0/а или /(?а:\)/, или за- 
действуйте более конкретное свойство \р{РО5ТХ_0191{}. 


Если требуется извлекать любые десятичные цифры из любого алфавита и ис- 
пользовать их в программе как числа, можно воспользоваться функцией пип из 
модуля Џпісоде: :ЏСР. 


иѕе у5. 14; 

иѕе иї+#8; 

иѕе Џпісоде` ‘ИСО дм(пит); 

ту флип; 

а (жук =- /(\0+)/) { 
$пит = пит(%$1); 
ріп? “Найдено число: %/\п”, Фпит; 
# Найдено число: 4567 


} 


Регулярные выражения позволяют проверять свойства символов, однако не спо- 
собны определять, какими свойствами символ обладает (во всяком случае, без 
проверки всех свойство по списку). А иногда действительно бывает необходимо 
знать это. Например, если необходимо узнать, какому алфавиту принадлежит 
код символа, или к какой основной категории относится символ. Для этого мож- 
но использовать тот же самый модуль /п1соде: :)С0. Ниже приводится программа 
вывода свойств, которые могут пригодиться при поиске по шаблону. 


и5е у5.14: 
иѕе Оға; 
иѕе магпіпоѕ; 


иѕе Џпісоде: :ЏСр 9м( сһагіпғо ); 
иѕе Џпісоде: :№огта117е ом( МЕБ); 


## раскомментируйте следующую строку чтобы использовать декомтозицию 
ту фтуэтегу = ## №0 _ 
өс 
Рог ту $сһг (5р111 //, $пузтегу) { 
пу $с1 = сһагіпҒо(ога $сһ”=); 
ргіпі "0+", $%сі{соде}; 
ргіпЕ?  \№9%$}°. "\п\Е”, $$с1 {пате}; 


реп” дс=", $$с1 {сатедогу}, 
ргіпі ” ѕсгірі=", ффсі{ѕсгірї}; 
ргіпі ” ВС=”, $$с1{61091}; 
ргіпі " тіггогед=", $%фсі{тіггогеа}, 
ргіпі ” ссс=”, $$с1 {сотріпіпо); 
ргіпі “ пу=”, $$с1 {питег1с}; 


ргіпі “\п”; 
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После запуска эта программа выведет: 


+0960 \М{ОЕМАМАСАВІ ОТСТТ ЗЕУЕМ} ос=№ ѕсг1рт=ремападаг1 
ВС=1 паггогед=Ь ссс=0 пу=7 

(+008Е \МУЦЕСАН РВАСТТОМ ТНВЕЕ ОЦААТЕН$} дс=№ ѕсгірї=Соптоп А 
ВС=0№ тіггогед=0№ ссс=0 пу=3/4 

Џ+00Е7 \М{1АТТК МАЦ ТЕТТЕВ С МІТН СЕОІША} ос=11 ѕсгірї=[атіп 
ВС=1 тіггогед=1 ссс=0 пу= 

О+ТЕ6Е \М{СВЕЕК САРТТАЕ ГЕТТЕВ ОМЕСА ИТТН рАЅІА АМО РЕАТЗРОМЕКТ } 
дс=іи ѕсгірі=6бгеек ВС=1 тіггогед=і ссс=0 пу= 


Если удалить комментарий, препятствующий декомпозиции МЕР”, будет выве- 
дено: 


+0960 \М{ОЕУАМАСАВІ ОТСТТ ЗЕУЕМ} ос=№ ѕсгірі=еуапада"і 
ВС=Ё тіггогед=1 ссс=0 пу=7 

Џ+ООВЕ \М{УЦЕ САА ЕВАСТІОМ ТНВЕЕ ОЏАВТЕВ} ос=№ ѕсгірі= Соттоп 
ВС=ОМ тіггогед=0№ ссс=0 пу=3/4 

0+0063 \МІАТІМ МАГ 1ЕТТЕВ С} ос=11 ѕсг1рї=1ат1п 
ВС=Ё тіггогед=1 ссс=0 пу= 

+0327 \МСОМВІМІМО СЕОТЬЕА} ос=Мп ѕсгірі=Іпһегітеа 
ВС=М5М тіггогей=№М ссс=202 пу= 

+03АЯ \М{СВЕЕК САРТТАЕ 1ЕТТЕВ ОМЕСА} дс=№и 5сгірї=бгеек 
ВС=Ё тіггогей=1 ссс=0 пм= 

+0314 \М{СОМВІМІМО ВЕМЕВЅЕЮ СОММА АВОУЕ} ос=Мп ѕсгірї=Іпһегітей 
ВС=М№М тіггогед=№М осс=230 пу= 

(+0342 \МЕСОМВІМІМС СВЕЕК РЕЋІЅРОМЕМІ } ос=Мп ѕсгірї=1Іпһег1теб 
ВС=М$М тіггогед=№5М ссс=230 пу= 


Определение пользовательских границ 
в регулярных выражениях 


Метасимволы \0 и \В, обозначающие границу слова и не-(границу слова), соответ- 
ственно, опираются на текущее определение метасимвола \у (здесь подразумева- 
ется, что они изменяют своє значение наряду с \м при переходе на семантику 
АЗСП с помощью модификатора /а или /аа). 

Если это не тот тип границ, что вы ищете, всегда можно создать собственное оп- 
ределение границ, опираясь на произвольные условия, такие как границы алфа- 
вита. Ниже приводится такое определение \Б: 


(2(2<= \м) # если слева символ слова 
(71 \м) # тогда справа должен быть не символ слова 
| (= \м) в иначе справа должен быть символ слова 
) 
А так выглядит определение \В: 
(2(7<= \м) # если слева символ слова 
(?= \м) # тогда справа должен быть символ слова 
| (21 \м) # иначе справа должен быть не символ слова 
) 


Теперь, когда вы знаете, как определяются границы слов и, соответственно, точ- 
ки, таковыми не являющиеся, то сможете определять собственные границы, из- 
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меняя условия там, где находится метасимвол \м в шаблонах выше. Нужно лишь 
проследить за тем, чтобы ваше определение создавало условие фиксированной 
ширины - так его можно будет использовать в ретроспективной проверке. Это оз- 
начает, что нельзя использовать такие метасимволы, как \Х или \В, соответствия 
которым имеют переменную длину. Проще всего для этих целей использовать 
свойства или классы символов. Например, для определения символов из грече- 
ского алфавита можно было бы использовать свойство \р{бгеек}, но лучше будет 
добавить свойство Тппег1тед, чтобы не пропустить комбинационные знаки, поэто- 
му используйте класс [\рібгеек}\р{Іпһегіїеа}]. 


Например, ниже представлены подпрограммы для регулярного выражения, реа- 
лизующие такого рода действия: 


(?(ОЕРТМЕ) 
(2<0геек1іѕћ> г\р{бгеек}\р{1пһег1їед}] ) 
(?<ипдгеек11$ћ> [7\ьібгеек}\р{Іпһегіїеа} ] ) 
(2<9геек боџпдагу> 
(2(7<= (?&огеек1іѕћ)) 
(?! (?&огеек1їіѕћ)) 
| (2= (?&9геек1іѕћ)) 


) 
(?<дгеек_попроипдагу> 
(?(?<= (?&огеек1іѕћ)) 
(7= (?&огеек1іѕһ)) 
і (2! (?&огеек1іѕћ)) 


) 


Для классов символов, являющихся результатом сложения. вычитания, отри- 
цания и пересечения существующих свойств Юникода, как в подпрограмме 
<дгеек11іѕћ> выше, может пригодиться возможность определять пользовательские 
свойства. Нестандартные свойства выглядят как самые обычные свойства. На- 
пример: 


зиб Іѕзбгеек11іѕћ { 
гетигп << ЕМО’, 

+0178: :Іѕбгеек 

+иТР8 : : Т$Тпнег {ед 

ЕМО 

} 


Теперь можно использовать \р{1Іѕбгеек11ѕћ} и \Р{Т$Сгеек11$1} в шаблонах, скомпи- 
лированных в том же пакете, что и подпрограммы. Как собрать все это воедино. 
рассказывается в следующем разделе. 


Укрепляем характер созданием символов 


Чтобы определить собственное свойство, необходимо написать подпрограмму 
с именем свойства (см. главу 7). Из соображений безопасности (неквалифициро- 
ванное) имя такой подпрограммы должно начинаться с префикса 15 или Іп. Под- 
программа должна быть определена в пакете, где используется свойство (см. гла- 
ву 10), т.е. если свойство требуется в нескольких пакетах, его необходимо либо 
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импортировать из модуля (см. главу 11), либо наследовать как метод класса из па- 
кета. в котором оно определяется (см. главу 12). 


Помимо соответствия организационным требованиям подпрограмма должна воз- 
вращать данные в формате файлов, находящихся в каталоге РАТН_ ТО РЕВ! ІВ/иті 
соде/Ів. То есть, возвращать список символов или диапазонов символов в шестна- 
дцатеричном виде, по одному в строке. Если возвращается диапазон, два числа, 
представляющих диапазон, должны разделяться символом табуляции. Допус- 
тим, что требуется создать свойство, которое имело бы истинное значение для 
символов, попадающих в диапазон любой из японских слоговых азбук (Капа), из- 
вестных как хирагана (№1гахапа) и катакана (КаёаКапа). Для этого можно было 
бы определить два диапазона: 


ѕир ТпКапа { 
гетигп <<'ЕМ№О ; 


3040 ЗО9ғ 
ЗОАО ЗОҒЕ 
ЕМО 


} 


С другой стороны, это же свойство можно было бы определить через существую- 
щие свойства: 


ѕир ІпКапа { 

гефигп <<`ЕМ№О': 
+иЁ#8 : :ІпНі гадапа 
+0ЁРВ: :ІпКатакапа 
ЕМО 
} 


Вычитание множеств выполняется с помощью префикса «—». Допустим, что необ- 
ходимо обеспечить соответствие свойства только актуальным символам, а не диа- 
пазонам. Исключить неопределенные коды можно вот так: 


зиб ІѕКапа { 

гефигп << ЕМ ; 
+01#8: : ІпНі гадапа 
+0178: : ТпКатаКапа 
—И ЕВ: : 1$Сп 
ЕМО 
} 


Можно также использовать дополнения наборов символов при помощи префикса 
«1»; 


ѕиб Іѕ№о+Капа { 
гетигп <<'ЕМ№О”; 

108: : ІпНігадапа 

-01#8: :ІпКатакапа 

+18 `` ІѕСп 

ЕМО 

} 


Пересечения определяются с помощью префикса ч&», что бывает полезно для оп- 
ределения общих символов, входящих в два (или более) класса. 
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ѕиб ІѕбгаесоВотаптТії1е {<<‘ЕМО_ОЕ_ЗЕТ`} 
+8: :Іѕ1аТіп 

+128: :Іѕбгеек 

&01#8..ІѕТіїЛе 

ЕМО _ОЕ_ЅЕТ 


ѕир Іѕбгеектії1е {<<` ЕМО ОЕ _ЅЕТ } 
+тазп: : Іѕ$бгаесоВотаптТії1е 

-иЄ#В: .І51аїіп 

ЕМО_ОЕ_ЅЕТ 


Важно помнить, что префикс «&» не может предшествовать первому множеству, 
иначе получится пересечение с пустым множеством, т.е. пустое множество. 


В самом Рег используются точно такие же уловки для определения «традицион- 
ных» классов символов (таких как \\), когда вы включаете их в собственные клас- 
сы символов (такие как [-\м\5$]). Кому то может показаться, что, чем сложнее пра- 
вила, тем медленнее они будут выполняться. Но в действительности, как только 
Рей вычислит битовый шаблон для конкретного 64-битового образца свойства, 
он сохранит его, и никогда не будет выполнять повторный перерасчет шаблона. 
(Применение 64-битовых образцов даже не требует декодирования данных в ко- 
дировке ОТЕ-8 при поиске.) Так что все классы символов, встроенные или ваши 
собственные, работают одинаково быстро. 


Чтобы увидеть другой подход к настройке простым изменением синтаксиса клас- 
сов символов в квадратных скобках, загляните в модуль \/п1соде: :Ведех: :5еї из ар- 
хива СРАМ. 


Создавая пользовательские свойства с именами, назначенными пользователем, 
можно даже организовать управление неиспользуемыми кодами символов, не 
прибегая к загадочным числовым значениям. Например, в Юникод пока не был 
включен алфавит Тепсуаг (эльфийский)!, хотя в планах он уже стоит - в конце 
концов, существует уже множество карт Средиземья. Но это не останавливает 
дизайнеров шрифтов, создающих великолепные шрифты для символов из алфа- 
вита Тепе\аг. Некоторые шрифты используют блоки кодов, зарезервированных 
непосредственно для алфавита Тепр\аг, но при этом большинство используемых 
кодов приходится на область для частного использования. В любом случае, этим 
кодовым числам еще не присвоены ни имена, ни свойства. 


Для Рен это не является барьером, потому что он позволяет легко создавать соб- 
ственные имена и свойства для символов. Один из существующих в Ре! модулей 
поддержки алфавита Тепеуаг описывает имена символое следующим образом: 


ТЕМСМАН ТЕТТЕВ ТІМСО ТЕМСМАВ ОТСТТ 7ЕВО 
ТЕМСМАН 1ЕТТЕВ РАВМА ТЕМСМАВ ОТСТТ ОМЕ 
ТЕМСМАН ТЕТТЕВ САЁЕМА ТЕМСМАВ ОТСТТ ТМО 
ТЕМСМАН ТЕТТЕВ ОЏЕЅЅЕ ТЕМСМАВ ОТСТТ ТНАЕЕ 


что позволяет пользоваться ими, как показано ниже: 


1Е ($е1уіѕћ =- /АМТЕМСМАН 1ЕТТЕВ ЗТЕМЕ МУОУЕВМА}/) {.. * 


1 Сіті (Кирт, Кертар) и Тепемаг (Тенгвар) — изобретенные Дж. Р.Р. Толкиеном два вида 
эльфийских алфавитов – рунический (Кертар) и буквенный (Тенгвар). – Прим. ред. 
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без всяких помех. К кодам символов из алфавита Тепёу’аг можно даже приме- 
нять сђагпапез: :уіасоде, чтобы получать их имена. Более того, в модуле даже опре- 
делены свойства символов из алфавита Тепрмаг: 


Іп_Тепомаг Іп_Тепомаг_М№тега15 
Іп_Тепомаг_Сопѕзопапїѕ 15 Тепомаг_Ресіта1 
Тп_Тепдмаг_\оме1 $ 15_Тепдиаг_Оиодес1та1 


Тп_Тепомаг_А1рнабе{1с$ Тп_Тепдмаг_Магк$ 
Тп_Тепдиаг_Рипсфиа оп Тп_Тепдмаг_А1рпапитег1с$ 


что позволяет писать такой программный код на Регі: 


ргіпі "М" 1е /Ар{Тп_Тепомаг_АТрпапитег1с$}/; 
рг1пЕ “А” 1? /\р(Тп_Тепомаг_Атрпабе{1с3}/; 
ргіпі “С” і? /\р{Іп_ Тепомаг_ Сопѕопапїѕ} /; 
ргіпі "№" 1? /\р{Іп Тепомаг Моме15}/; 


или даже: 


$ТЕМСМАН_СВАРНЕМЕ = аг{ 
(?> 
(7= \р{Тп_Тепомаг} ) \Р{Тп_Тепомаг_Магкз} 
\р{Тп_Тепдмаг_Магк$} * 
) | \р{Тп_Тепдмаг_Магкз} 
}х; 


Попытки написать нечто подобное без применения имен абстракций для симво- 
лов и свойств больше напоминают попытки писать программы с использованием 
числовых адресов в памяти вместо имен переменных. Безусловно, при большом 
желании это вполне возможно, но такой стиль не будет гармонировать с имеющи- 
мися возможностями, и подобные программы будет невероятно сложно читать 
и сопровождать. Позволяя определять собственный язык даже для таких узко- 
специализированных применений, Рег! помогает писать программный код, кото- 
рый выглялит чише и проще. 


Ссылки 


Язык Ре! близко, насколько это возможно, придерживается стандарта Юникода 
во всех возможных аспектах. Этот стандарт включает различные приложения 
и технические отчеты. Некоторые из них имеют прямое отношение к темам, об- 
суждавшимся выше, включая: 


САХ #44: Опісоӣе Сћағасіег Раѓађаѕе 
ОТ #18: Оісоде Веящаг Ехргезюпз 
(АХ #15: Опісоде Могтаіігаѓіоп Еогтз 
ОТ #10: Отсоае СоПаѓіоп АІсогіїіћт 
(АХ #29: Опісойе Техі Ѕестепіаііоп 

ПАХ +14: Опісойе Гпе Вгеакіпс АІсогйћт 
САХ #11: Еаѕі Аѕіап УПА 


Подпрограммы 


Как и многие другие языки, Рег! позволяет программисту создавать собственные 
подпрограммы.! Эти подпрограммы могут определяться в любом месте основной 
программы, загружаться из других файлов с помощью ключевых слов 00, гедиіге 
или изе либо генерироваться на этапе выполнения с помощью ема]. Их можно 
даже загружать на этапе выполнения программы - этот способ описан в разде- 
ле «Автозагрузка» в главе 10. Вызов подпрограмм может осуществляться кос- 
венным образом, посредством переменной, содержащей имя подпрограммы или 
ссылку на нее, либо через объект, позволяя ему самому определить, какую под- 
программу вызвать. Можно также создавать анонимные подпрограммы, доступ- 
ные только через ссылки, и использовать их для клонирования новых, почти 
идентичных функций через замыкания (с10зигез), описываемые в одноименном 
разделе главы 8. 


Синтаксис 


Объявить именованную подпрограмму, не определяя ее. можно одной из следую- 
щих форм: 

ѕир МАМЕ 

зиб МАМЕ РВОТО 


$и6 МАМЕ АТТАЅ 
вир МАМЕ РВОТО АТТВЅ 


Именованную подпрограмму можно объявить и определить, добавив блок ВОСК: 


зир МАМЕ ВЕОСК 
виб МАМЕ РВОТО ВЕОСК 
ѕир МАМЕ АТТА ВЕОСК 


ѕир МАМЕ РВОТО АТТАЅ ВІОСК 


1 Еще мы называем их функциями, но в Рег! функции и подпрограммы — одно и то же. 
Иногда мы будем называть их методами. Методы определяются так же, как подпро- 
граммы, но вызываются иначе. 
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Чтобы создать анонимную подпрограмму или замыкание, достаточно опустить ее 
имя: 


ѕиб ВЕОСК 
Е] РВОТО ВОСК 
$06 АТТАЅ ВЕОСК 
$46 РВОТО АТТА5 ВЕОСК 


РАОТО и АТТА$ обозначают прототип и атрибуты; каждой из этих конструкций по- 
священ свой раздел этой главы. РАОТО и АТТЕ5 не столь важны: более существенны- 
ми являются МИЕ и ВЕОСК, даже если они отсутствуют. 


Но как вызвать подпрограмму без имени? Просто сохраните значение, возвра: 
щаемое формой ѕиб, которая не только компилируется на этапе компиляции (оче: 
видно), но и возвращает значение во время выполнения: 


$ѕџргеѓ = ѕџир ВОСК; 
Чтобы импортировать подпрограммы из другого модуля, нужно сказать: 
иѕе МОРІЛЕ дм(МАМЕТ МАМЕ? МАМЕЗ. .. ); 


Прямой вызов подпрограмм осуществляется так: 


МАМЕ( 1 ТТ) # & не обязателен, если есть скобки. 

МАМЕ ІТ # Скобки не обязательны при наличии предварительного объявления 
# ѕир или инструкции импортирования. 

&МАМЕ # Передает подпрограмме текущее значение @_ 


# (в обход прототипов). 


Для косвенного вызова подпрограмм (по имени или по ссылке) используется син- 
таксис: 


&$ѕиргеғ(/ 157) # & нельзя опускать при косвенном вызове 
фзибге!->(115Т) # (если только не используется инфиксная запись). 
&Фѕиргеѓ # Передает подпрограмме текущее значение @_ 


Официальное имя подпрограммы начинается с префикса &. Подпрограмму можно 
вызвать по имени с префиксом, но обычно он не используется, как и круглые скоб- 
ки, если подпрограмма была предварительно объявлена. Однако префикс & явля- 
ется обязательным, когда нужно указать имя подпрограммы, чтобы, например, 
передать его в качестве аргумента функции 0е!1пе9 или споет, либо создать ссылку 
на именованную подирограмму, как в случае $5и0ге* = пате. Префикс & обяза- 
тельно должен использоваться и в косвенных вызовах подпрограмм, в конструк- 
циях &$зибгег() или &{$зи6ге!}(). Однако более удобная конструкция $зи6те!->() 
префикса & не требует. Дополнительные сведения о ссылках на подпрограммы 
приводятся в главе 8. 


Рег] не регламентирует использование заглавных букв в именах подпрограмм. 
Однако существует неформальное соглашение, в соответствии с которым имена 
функций, неявно вызываемых системой времени выполнения Рег] (ВЕСІМ, СНЕСК, 
ОМТТСНЕСК, ІМІТ, ЕМО, АОТОГ ОАР, ОЕЗТВОУ и другие, перечисленные в главе 14), содержат 
только заглавные буквы, поэтому такого стиля именования желательно избе- 
гать. (Но имена подпрограмм, возвращающих константы, обычно тоже состоят 
только из заглавных букв. Это нормально. Надеемся...) 
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Пока вы не слишком устали от всего этого синтакеиса, просто запомните, что 
обычное определение простой подпрограммы выглядит примерно так: 


ѕир га221е { 
ргіпі “ОК, уои'ме Бееп га771е9. \п”; 


} 
а обычный способ ее вызова: 
га221е(); 


Здесь мы опустили входные и выходные данные (аргументы и возвращаемые зна- 
чения). Но модель обмена данными с подпрограммой, действующая в Реті, на са- 
мом деле очень проста: все аргументы передаются функции как один плоский 
список скаляров; множество возвращаемых значений также передается в точку 
вызова как один плоский список скаляров. Поскольку речь о списочном контек- 
сте, то, разумеется, все массивы и хеши, передаваемые таким образом, интерпо- 
лируют свои элементы в плоский список, что сопряжено с потерей индивидуаль- 
ности элементов (впрочем, эта проблема легко решается), а такая автоматическая 
интерполяция списка зачастую оказывается весьма удобной. Списки аргументов 
и возвращаемых значений могут содержать сколь угодно много или сколь угодно 
мало скалярных элементов (хотя можно наложить ограничения на список аргу- 
ментов посредством прототипов). Это возможно благодаря тому, что архитектура 
Ре! построена на вариадических (рагіайіс) функциях, принимающих произволь- 
ное число аргументов, тогда как в язык С эти функции довольно неуклюже втис- 
нуты, чтобы можно было вызывать ргіпі 3). 


Что ж, намереваясь создать язык, позволяющий передавать произвольное число 
произвольных аргументов, следует озадачичься тем, как облегчить обработку 
этих произвольных списков аргументов. Любые аргументы поступают в подпро- 
грамму Ре! в виде массива @_. Если функция вызвана с двумя аргументами, внут- 
ри функции они будут доступны как первые два элемента этого массива: $ [0] 
и $ Г]. Поскольку @ – это обычный массив с необычным именем, с ним можно 
делать все, что обычно делают с массивами.! Массив @ является локальным, но 
его элементы служат псевдонимами для реальных скалярных параметров. (Это 
называется семантикой передачи по ссылке.) Поэтому можно изменять фактиче- 
ские параметры, изменяя соответствующие элементы массива @_. (Однако это де- 
лается редко, потому что в Рег очень легко возвращать значения, представляю- 
щие интерес.) 


По умолчанию подпрограмма (как и любой другой блок) возвращает значение по- 
следнего вычисленного выражения. Также можно явно использовать оператор 
гефигп, чтобы определить возвращаемое значение и выйти из подпрограммы в лю- 
бой ее точке. В любом случае, поскольку подпрограмма вызывается в скалярном 
или списочном контексте, то и последнее выражение в подпрограмме вычисляет- 
ся втом же контексте. 


1 Это область, в которой Рег! более ортогонален, чем типичные языки программирования. 


. 
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Приемы работы со списками параметров 


В Ре! пока нет именованных формальных параметров, но на практике достаточ- 
но скопировать @_ в список значений пу, прекрасно справляющийся с ролью спи- 
ска формальных параметров. (Не случайно копирование значений изменяет се- 
мантику передачи по ссылке на семантику передачи по значению. Обычно имен- 
но такого поведения ожидают программисты, даже если не владеют специальной 
терминологией.) Вот типичный пример: 


зир маузетепм { 

пу($Кеу, $уа1ие) =@ ; 

ФЕМ { $Ккеу} = $уа1ие ип1еѕѕ ФЕМ\{$кеу}; 
} 


Но вы не обязаны давать имена аргументам функции - и в этом весь смысл суще- 
ствования массива @ . Например, чтобы найти максимальное значение, можно 
напрямую перебрать элементы массива @ : 


36 тах { 
пу $тах = $8111 (@_); 
Ғог му $1+ет (@_) { 
$тах = $іїет іҒ $тах < $іїеп; 
} 


геш п $тах; 


} 
фреѕтоау = мах($топ, $ие, $мед, $ЕНи, $Ғгі); 


Аргументы со строго определенным порядком прекрасно подходят для функций 
с небольшим количеством параметров, но по мере увеличения их числа становится 
сложно запоминать, какой аргумент для чего используется, какие являются не- 
обязательными, а у каких имеются значения по умолчанию. Более гибкое реше- 
ние этой проблемы: передавать подпрограмме аргументы в виде пар имя/значение. 
Первый элемент в каждой паре – имя аргумента; второй – его значение. Это помо- 
гает создавать самодокументирующий код, ведь по именам параметров можно по- 
нять, для чего они предназначены, не заглядывая в полное определение функции. 
Более того, пользователям вашей функции уже не нужно запоминать порядок 
следования аргументов, а неиспользуемые аргументы они вольны опускать. Мы 
настоятельно рекомендуем стиль, основанный на именованных параметрах. 


Фокус в том, чтобы присвоить список аргументов @ хешу: 


сопҒідигатіоп(РАЅЅМОВО => "хуггу”. МЕВВОЅЕ => 9. СОВЕ => 0): 


ѕио сопҒідигатіоп { 

пу Хорііопѕ = @_ 

ргіпе "Максимально подробно. \п" 1 $орііопо{УЕАВОЅЕ} == 9; 
} 


Это очень гибкий подход, и, чтобы это продемонстрировать, мы приведем пример 
из рецепта «Передача именованных параметров» (книга «Рей СооКфооК», раздел 
«Подпрограммы»)!. 


1 Т. Кристиансен, Н.Торкингтон «Рег!: библиотека программиста». — Пер. с англ. — СПб.: 


Питер, 2001. 
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+һеғипо(ІМСВЕМЕМТ => “205”, ЗТАВТ => “+5”, РІМІЅН => "+30т"); 
іһеҒипс($ТАВТ => "+5", РІМІЅН => +30”); 

іһеғипс{ РІМІЅН => “"+30т”), 

Тһеғипс(5ТтАнт => "+ыт”, ІАСВЕМЕМТ => “155”); 


В то жевремя, в подпрограмме создается хеш, заполняемый значениями по умол- 
чанию, а также значениями из массива с парами именованных параметров. 


ѕир +ћеғипс { 


пу %агоѕ = ( 
ТАСВЕМЕМТ => “10$”, 
ҒІМІЅН => 0, 
ЗТАВТ => 0, 
о, # фактические аргументы затирают установки по умолчанию 


); 
1# ($агоѕ{ІМСАЕМЕМТ} =- /тф/ ) { } 


} 


Именование аргументов с последующим присваиванием @_ хешу %агдѕ позволяет 
избавиться от необходимости запоминать порядок следования аргументов и де- 
лает любой аргумент необязательным, автоматически назначая ему значение по 
умолчанию. 


С другой стороны, есть ситуации, когда мы предпочтем неименованные аргумен- 
ты. Например, если необходимо изменить фактические аргументы функции: 


ирсазе_1п($и1 $\2); # эта подпрограмма изменяет $1 и $%2 
зи6 ирсаѕе іп { 

Рог (@_) {$_ = ис($_) } 
} 


Конечно, таким способом нельзя изменять константы. Окажись аргумент ска- 
лярным литералом, например строкой “хоббит", или скалярной переменной, дос- 
тупной только для чтения, например $1, при попытке изменить его Ре] возбудил 
бы исключение (предположительно, фатальное; возможно. угрожающее вашей 
карьере). Например, следующий вызов не будет работать: 


ирсазе_1п(“фредерик”); 


Было бы безопаснее, если бы функция ирсазе_1п возвращала копии своих пара- 
метров, а не изменяла их по месту: 


($%3, $4) = ирсазе($\1, $\2); 

$и6 ирсазе { 
пу ёрагтѕ = пар { ис } @; 
# Вызов выполнен в списочном контексте? 
гетигп маптаггау ? ёрагтѕ : $рагт$[0]; 


} 


Обратите внимание, что этой функции (не имеющей прототипа) безразлично, что 
ей передается: скаляры или массивы. Регі расплющит все в один большой, длин- 
ный, плоский список аргументов @ . Это один из случаев, когда проявляется про- 
стота передачи аргументов в Регі. Функция ирсазе будет отлично работать и без 
изменения определения ирсазе, даже если передать ей такие аргументы: 
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@пем1151 = ирсаѕе(@11511, @11512); 
@пем11$1 = ирсаѕе( $р1ії /:/, $маг ) 


Но не поддавайтесь соблазну написать так: 
(@а, @6) = ирсаѕе(@11511. @11512); # НЕВЕРНО 


Почему? Потому что подобно плоскому списку входных параметров @_, список 
возвращаемых значений является плоским. В результате все значения окажутся 
в ба, а в 66 запишется пустой список. Как этого избежать, рассказывается в разде- 
ле «Передача ссылок». 


Индикация ошибок 


Если потребуется организовать возврат из функции так, чтобы в месте вызова 
можно было определить, что произошла ошибка, проще всего это сделать с помо- 
щью простой команды гетигп без аргумента. В результате при вызове функции 
в скалярном контексте возвращается ипіеї, а в списочном – пустой список. 


В крайнем случае для индикации ошибки можно возбудить исключение. Однако 
пользуйтесь этим средством экономно, иначе вся программа окажется замусорен- 
ной обработчиками исключений. Например, неудачная попытка открыть файл 
едва ли является исключительным событием для функции открытия файла. 
А вот если проигнорировать эту ошибку, мы вполне можем столкнуться с таким 
событием. Встроенная функция мапїаггау возвращает ипдет, если ваша функция 
вызвана в пустом контексте, и с ее помощью можно узнать, что вас игнорируют: 


ЇР ($5отеЁһіпо_мепї_амгу) { 
гефигп і? деҒіпед мапїаггау; # хорошо, не пустой контекст. 
біе "Посмотри-ка на мою ошибку, бестолочь! ! ! \п", 


Вопросы областей видимости 


Подпрограммы могут вызываться рекурсивно, потому что каждый вызов получает 
собственный массив аргументов, даже если подпрограмма вызывает саму себя. Ес- 
ли подпрограмма вызывается по имени с префиксом 8, список аргументов можно 
не передавать. На этот случай предусмотрена особая модель поведения: вызывае- 
мой подпрограмме неявно передается массив ё вызывающей подпрограммы. Это 
механизм повышения эффективности, и новичкам, возможно, стоит его избегать. 


&Ғоо(1, 2,3), # передача трех аргументов 
#о00(1,2,3); # то же самое 


Ғоо(), # передача пустого списка 

&ғоо(); { то же самое 

&Ғоо; # Ғоо() получит текущие аргументы, как Ғоо(@_), но быстрее! 
Тоо; # то же, что и Ғоо(), если было объявление зир Тоо, 


# иначе голое слово "Ғоо’ 


Форма вызова префиксом & не только делает необязательным список аргументов, 
но и отключает проверку прототипа для передаваемых аргументов. Отчасти это 
обусловлено историческими причинами, а отчасти обеспечивает удобную возмож- 
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ность мошенничать тем, кто хорошо понимает, что делает. См. раздел «Прототи- 
пы» далее в этой главе. 


Переменные, используемые в функции, но не объявленные в ней, не обязательно 
будут глобальными переменными: они подчиняются обычным правилам Ре! для 
областей видимости блоков. Как рассказывалось в разделе «Имена» главы 2, поиск 
имен переменных сначала выполняется в окружающей лексической области (или 
областях) видимости, а затем в области видимости пакета. Поэтому подпрограм- 
ме доступны все переменные пу или ѕїаїе из охватывающей области видимости. 


Например, следующая функция Бипрх использует лексическую переменную $х, 
областью видимости которой является файл, поскольку область видимости, со- 
держащая объявление пу (т.е. сам файл), не была закрыта до определения подпро- 
граммы: 


# начало файла 
пу $х = 10; # объявление и инициализация переменной 
зи битрх { $х++ } # функция может видеть внешнюю лексическую переменную 


Программисты на Си С++, вероятно, сочтут $х «файловой статической» перемек- 
ной. Она недоступна функциям в других файлах, но глобальна с точки зрения 
функций, определенных после объявления пу. Программисты на С, ищущие 
в Рег] «статические переменные» для файлов или функций, не найдут в нем клю- 
чевого слова «бас». Программисты на Рег! обычно избегают этого слова, потому 
что статические системы мертвы и скучны, да и вообще исторически сложилось 
так, что это слово затаскали. 


В лексиконе Ре! нет слова «зфайс», но программисты на Регі легко создают пере 
менные, локальные для функций и сохраняющие свое значение между вызова: 
ми. Для этого служит похожее понятие з{ате-переменных, и мы обсудим его чуть 
позже. Но это не единственный снособ получить такое поведение. Более мощные 
примитивы областей видимости Регі сочетаются с автоматическим управлением 
памятью так, как и не снилось ищущим ключевое слово єзіаѓіс». 


Лексические переменные не уничтожаются автоматически при выходе из их об- 
ласти видимости; они попадают в переработку, только когда болыше не использу- 
ются, что значительно важнее. Чтобы создать локальную переменную, сохра- 
няющую свое значение между вызовами функции, заключите всю функцию в до- 
полнительный блок и поместите туда же объявление пу. В блок можно поместить 
сразу несколько функций, и все они получат доступ к переменной, которая иначе 
была бы недоступна: 


{ 
ту Фсоипфег = 0; 
вир пехї _соипїег { гетигп ++$соиптег } 
ѕир ргеи соипфег { гефигп --Фсоиптег } 
} 


Как всегда, лексическая переменная доступна только коду в той же лексической 
области видимости. Но имена функций в этом примере доступны глобально (внут- 
ри пакета), и поскольку функции определены внутри области видимости $соџпїег, 
они могут обращаться к этой переменной, недоступной для других функций. 


Если функция загружена через геди1ге или изе, проблем, скорее всего, не возник- 
нет. Если же все происходит в основной программе, нужно, чтобы на этапе выпол- 
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нения присваивание переменной пу выполнялось достаточно рано. Для этого мож- 
но поместить весь блок перед основной программой, либо заключить его в блок 
ВЕСІМ или ІМІТ, чтобы гарантировать исполнение до запуска программы: 


ВЕСІМ { 
пу @эса]е = ("А" 767); 
пу $поѓе = -1, 


ѕир пехї ріїсћ { гесигп $ѕса1е[ ($поѓе += 1) %= @зса1е ] }; 
} 


Блок ВЕСТМ не влияет на определение подпрограммы и на сохранность значений 
лексических переменных, используемых подпрограммой. Он нужен, только что- 
бы гарантировать инициализацию переменных до первого вызова подпрограм- 
мы. Объявлениям локальных и глобальных переменных посвящены разделы 
«ту», «зіаѓе» и «оцг» главы 27. Конструкции ВЕСТМ и ІМІТ описываются в главе 16. 


Чтобы упростить объявление переменных как можно ближе к месту их использо- 
вания, в язык Рег] было введено объявление ѕїаїе, представляющее собой разно- 
видность объявления пу. Чтобы использовать его, включите в код прагму, регла- 
ментирующую версию Рег! (не ниже у5.10). 


После этого ключевое слово ѕіаїе можно будет использовать для объявления лек- 
сических переменных, инициализируемых только один раз: 


изе у5. 14, 


ѕир Битрх { 
зтафе $х = 10; # инициализируется только один раз 
гефигп $х++; 

} 


Эта функция действует в точности, как предыдущая, возвращая сначала 10, за- 
тем 11, затем 12 и т.д. А следующая функция создает локальный статический 
хеш, хранящий счетчики различных значений, полученных функцией: 


зиб зееп_соипт { 
ЗТате %соипт; 
пу $іїет = $1111(), 
гетигп ++фсоипї{$1їтет} 


} 


Декларация переменной ѕЅїаїе отличается от прочих деклараций переменных 
тем, что позволяет инициализировать только простую скалярную переменную. 
Массивы и хеши тоже можно объявлять как ѕїаїе-переменные, но их нельзя ини- 
циализировать тем же волшебным образом, что скаляры. Фактически, этс не яв- 
ляется таким уж большим ограничением, потому что сохраняется возможность 
инициализировать ссылку на желаемый тип, так как ссылка — это скаляр. На- 
пример, вместо: 


# нельзя использовать ѕїаїе %паѕћ = (....) 

ту Хһаѕһ = ( 
ВЕАОУ => 1 
МТЕТМС => 1, 
АВІЕ => 1 
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хеш можно объявить как ѕїаїе-переменную иначе: 


этафе $һаѕһге? = { 


ВЕАБУ => 
МІІРІМС -> 
> 


1, 
1. 
АВІЕ => 1, 


№ 


Ниже показано, как реализовать функцию пехї ріїсћ, описанную выше, с ис- 
пользованием ѕЅїаїе-переменных: 


ѕир пехі_ріїсћ { 

зфафе $зса1е = [ А” 76"; 

ѕта+е фпоте = -1; 

гетигп $зса1е->Г ($поїе += 1) %= @фѕса1е ]; 
} 


Основное преимущество объявления ѕїаїе заключается в отсутствии необходимо- 
сти использовать блок ВЕСТА (или ЏМІТСНЕСК), чтобы гарантировать инициализа- 
цию переменных до вызова функции. 


Наконец, когда мы говорим, что ѕїаїе-переменные инициализируются только 
один раз, мы не имеем в виду, что ѕѓаїе-переменные являются общими в отдель- 
ных замыканиях. Напротив, каждая из таких переменных инициализируется 
отдельно. Этим ѕїаїе-переменные отличаются от ѕїаїіс-переменных в других 
языках. 


Например, в обеих версиях приведенного ниже программного кода переменная 
$еросһ является лексической переменной, локальной для возвращаемого функ- 
цией замыкания. При этом в функции їіпег їћеп она инициализируется до того, 
как функция вернет замыкание, а в їіпег пом инициализация переменной $еросћ 
откладывается до момента, когда функция вернет замыкание в первый раз: 


ѕир їітег_Ёһеп { 
ту феросһћ = Ұіте(), 
гетигп зиб { 


}; 


ѕир їітег_пом { 
гефигп ѕир { 
зате $еросһ = їіте(); 
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Если потребуется передать в функцию или из нее более одного массива с сохране- 
нием их структуры, используйте механизм явной передачи по ссылке. Но прежде 
следует разобраться в особенностях работы ссылок, описанных в главе 8. В про- 
тивном случае этот раздел может показаться вам весьма загадочным. Впрочем, 
всегда ведь можно поразглядывать картинки... 
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Вот несколько простых примеров. Сначала определим функцию, ожидающую 
получить ссылку на массив. Если массив большой, передача ссылки выполняет- 
ся значительно быстрее, чем передача длинного списка значений: 


фтота1 = зип ( \@а ) 


зир ѕит { 
ту ($агеғ) = @, 
ту ($Тота1) = 0; 
Рог (@фагег) { Фжотат += $_ } 
гефтигп $Тота1; 


} 


Передадим функции несколько массивов, и заставим ее извлечь последний эле- 
мент каждого из них, вернув новый список, состоящий из этих бывших послед- 
них значений: 


@{а111п0$ = рортапу ( \@а, \@6, \@с, \@9 ) 


зиб рортапу { 
пу @геї115ї1 = ({); 
Рог пу ФагеЕ (@ ) { 
ризп @геї1151, рор @$агеғ; 
} 
гефигп @геї1151; 


} 


Следующая функция находит пересечение множеств и возвращает список клю- 
чей, имеющихся во всех переданных хешах: 


@соттоп = 1пег( \%Ро0, \Хбаг, \%дое ); 
ѕир іпїег { 
пу %ѕееп; 
Гог му $һге? (@)) { 
мһі1е (ту $К = еасһ ХФһге? ) { 
$ѕееп{$к}++; 
} 
} 
гетиғп огер { $зееп{$_} == ё } Ккеуѕ %еег- 
} 


До сих пор мы применяли самый обычный механизм для возврата списка. А что 
если потребуется передать или вернуть хеш? Если хеш только один или вы не воз- 
ражаете, чтобы несколько хешей объединились в один, сойдет обычное соглаше- 
ние по вызовам, хотя обходится оно дороговато. 


Как уже отмечалось, беда подкарауливает при такой записи: 


(ба, @5) 


Рипс(@с, @а); 


или такой: 


(%а, %6) = Ғипс(%с, %9); 


Такая запись попросту не работает. Она всего лишь устанавливает ба или Фа и очи- 
щает @6 или хр. Кроме того, вызываемая функция не получит в качестве аргумен- 
тов два отдельных массива или хеша: она получит один длинный список в ©. 
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Допустим, требуется, чтобы функция использовала ссылки и для входных, и для 
выходных данных. Следующая функция принимает в качестве аргументов две 
ссылки на массивы и возвращает две ссылки на массивы, упорядоченные по чис- 
лу элементов в этих массивах: 


($агеғ, Фьгег) = Гипс(\@с, \@а); 
ргіпі "@фагеғ больше, чем @$бгеГ\п” 
$96 Фипс { 
ту ($сгег Фагеғ) = @ ; 
1Ғ (@фсгеѓ > @$аге?) { 
геигп ($сгеѓ, Фагеғ); 
} е1ѕе { 
гетигп ($9геЁ, фсге#); 


} 


О передаче дескрипторов файлов или каталогов в функции и из них рассказыва- 
ется в разделах «Ссылки на дескрипторы файлов» и «Ссылки на таблицы симво- 
лов» главы 8. 
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Рей позволяет программисту определять собственные функции и вызывать их 
так же, как встроенные функции Регі. Рассмотрим ризН(@аггау, $1іїеп), ожидаю- 
щую получить ссылку на баггау, а не список значений в @аггау, чтобы можно было 
модифицировать массив. Прототипы позволяют объявлять подпрограммы, при: 
нимающие аргументы подобно многим встроенным функциям, т.е. с определен- 
ными ограничениями на число и типы аргументов. Мы называем их «прототи- 
пы», но они больше похожи на автоматические шаблоны контекста вызова, чем 
на то, о чем могут подумать программисты на С или Јауа. С помощью этих шабло- 
нов Ре] автоматически добавляет неявные символы обратной косой черты, вызо- 
вы ѕса1аг и все прочее, благодаря чему можно получить соответствие шаблону. 
Например, если объявить: 


зуб туриѕћ (+); 


функция пуриѕћ будет принимать аргументы в точности, как это делает рип. Что- 
бы все получилось, объявление функции должно быть видимо на этапе компиля- 
ции. Прототип влияет на интерпретацию вызовов функции, только когда опущен 
символ &. Иными словами, если вызвать ее как встроенную функцию, она будет 
вести себя как встроенная функция. А если вызвать ее как обычную подпрограм- 
му, она будет вести как обычная подпрограмма. Символ & подавляет проверку 
прототипа и соответствующие контекстно-зависимые эффекты. 


Прототипы принимаются во внимание только на этапе компиляции, и отсюда ес- 
тественным образом следует, что они не влияют на ссылки на подпрограммы ви- 
да \&Гоо или косвенные вызовы подпрограмм, такие как &{$зи6ге!} или $ѕиргеѓ->(). 
На вызовы методов прототипы также не оказывают влияния. Дело в том, что 
фактически вызываемая функция не определена на этапе компиляции, но зави- 
сит от иерархии наследования, которая устанавливается в Ре] динамически. 


Основное назначение прототипов — дать программисту возможность определять 
подпрограммы, действующие как встроенные функции. В табл. 7.1 перечислено 
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несколько прототипов, которые можно использовать для эмуляции соответст- 
вующих им встроенных функций. 


Таблица 7.1. Прототипы для эмуляции встроенных функций 


Объявление 


Зи 
ѕир 


ѕир 


ѕиб 


50б 


зир 
Е] 


пу1іпк ($$) 
тугемегзе (@) 
пујоіп ($0) 
турор (;+) 
пуѕр1ісе (+;$$0) 
пукеуѕ (+) 
пуріре (**) 
пуіпдех ($$; $) 


туѕуѕмгіїте (-$;$$) 


туореп (*; $0) 


туѕіп (_) 


пудгер (&@) 
шугапо ($) 
пуёіпе () 


ту1іпк $019, $пем 
пугеуегѕе $а,$0,%с 
пујоіп “:",$а,$6,$с 
турор ваггау 


иузр]1се @аггау, баггау, 0,@ризпте 


пукеуз %{$һаѕһге?} 


туріре ВЕАБНАМОЕЕ, ИВТТЕНАМОЕЕ 
пу1пдех &дет$1г1па, “ѕирѕїг 

пуіпдех &дет$111п9, "ѕирѕїг", Фэфагт 
пузузиге ООТЕ, $6и? 


пузузиге ОШТЕ, $0и?, Іепоїћ($0иҒ) Фо, ФфоғҒ 


туореп НАМОЕЕ 


туореп НАМОЕЕ, Фпате 
пуореп НАМОЕЕ, "1", @стд 


туѕ1п $а 
туѕіп 


тудгер { /Роо/ } $а, $0,%с 


тугапа 42 
пуїіпе 


Каждый символ прототипа (они перечислены в скобках в левой колонке). предва- 
ренный обратной косой чертой, представляет фактический аргумент (пример ко- 
торого приведен в правой колонке), который обязательно должен начинаться 
с этого символа. Как первый аргумент кеуѕ должен начинаться символом % или $, 
так и первый аргумент пукеуѕ должен начинаться символом %. Эту задачу решает 
специальный прототип +, который является сокращением для \[6%}.1 


Чтобы определить несколько допустимых типов аргумента с обратной косой чер- 
той, можно использовать групповую форму записи \[]. Например, объявление: 


ѕџиб туге? (\[$@6%8* 1) 


позволяет вызывать пугеѓ любым из следующих способов, а Рег сам позаботится, 


чтобы функция получила ссылку на указанный аргумент: 


пуге? $уаг 
пуге? баггау 
пугеғ %һаѕћ 
туге? &ѕиб 
туге? «9100 


Прототип операторов хешей несколько раз менялся. В у5.8 он выглядел как \%, ву5.12 – 
как \[0%], ав у5.14 он превратился в просто +. 
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Точка с запятой отделяет обязательные аргументы от необязательных. (Перед @ 
или % ее употребление излишне, так как списки могут быть пустыми.) Символы 
прототипа без обратной косой черты имеют особое значение. Каждый символ @ или 
% без обратной косой черты поглощает все остальные фактические аргументы и ус- 
танавливает списочный контекст. (Это эквивалентно / 157 в описании синтаксиса.) 
Для аргумента, представленного символом $, устанавливается скалярный кон- 
текст. Символ 8 требует ссылки на именованную или анонимную подпрограмму. 


В качестве последнего символа прототипа или непосредственно перед точкой с за- 
пятой вместо $ можно использовать _. Если этот аргумент не будет передан, вме- 
сто него будет использоваться текущая переменная $_. Например: 


зиь тутка1г(_;$) { 
пу $91гпате = з111%(); 
ту $таѕк = @ ? $111Е() . 0777; 
ту $тоде = Фтаѕк &- итаѕк(): 


} 


туткотг(Фратн. 01750); 
путкаіг(Фратһ); 
пупкаіг( ); # будет передано значение $_ 


Прототип + является особой альтернативой символу $, действующей подобно 
\[6%], когда передается литерал массива или переменнан-хеш, в остальных случа- 
ях он принудительно устанавливает скалярный контекст для аргумента. Это 
удобно для таких функций, которые могут принимать не только литерал массива 
(или хеша), но и ссылку на него: 


зиб туриѕћ (+68) { 
пу ФагеЁ = ѕһі, 
діе “Не массив и не ссылка на массив “ ип1еѕѕ геР(ФагеР) ед “АВВАУ”; 
ризп @Фагег, @; 

} 


При использовании прототипа + функция всегда должна проверять допустимость 
типа аргумента. (Мы преднамеренно реализовали его так, чтобы он не работал 
с объектами, ведь в противном случае поощрялась бы возможность нарушения 
инкапсуляции объектов.) 


Символ » позволяет подпрограмме принимать в соответствующей позиции все, 
что было бы принято встроенной функцией как дескриптор файла: голое имя, 
константу, скалярное выражение, фуре210Ъ или ссылку на уреғ1ор. Это значение 
будет доступно в подпрограмме как простой скаляр или (в двух последних случа- 
ях) как ссылка на $уре2]оЪ. Чтобы такие аргументы всегда преобразовывались 
в ссылки на фуреЕ]оЪ, используйте Ѕутро1::дџа1іѓу їо геї: 


иѕе Зутбо1 ‘дуа11Ру_фо_ге!’; 


зи туғі1епо (*) { 
пу $#һ = диа1і?у То ге(ѕһії+, са ег); 


} 


Обратите внимание, что последние три прототипа в табл. 7.1 обрабатываются 
особым образом. пудгер интерпретируется как настоящий списочный оператор, 
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тугапд — как настоящий унарный оператор с тем же приоритетом, что и гапд, 
а пу те – как настоящая функция без аргументов, типа їіпе. 


Это значит, что выражение: 
пуйте +2; 


дает в результате пуїіте() + 2, а не пуїзте(2), как было бы при разборе без прото- 
типа или с унарным прототипом. 


Пример пудгер показывает также, что & обрабатывается особым образом в качестве 
первого аргумента. Обычно прототип & требует наличия аргумента вроде \&ѓоо или 
3и6{}. Однако если это первый аргумент, можно пропустить ѕир в объявлении ано- 
нимной подпрограммы и просто передать голый блок в позиции «косвенного объек- 
та» (без последующей запятой). Изящество прототипа & состоит в том, что он позво- 
ляет создавать новый синтаксис при условии, что & находится в первой позиции: 


ѕир {гу (8$) { 
ту ($Егу, $саїсћһ) = @ ; 
ема1 { &фїгу }; 
ЇР ($6) { 
1оса1 $_ = $0; 
&$саїоһ; 
} 
} 
ѕир саїсһ (&) { $ [0] } 


{гу { 
діе "рһооеу"; 
} # не конец вызова функции! 
саїсћһ { 
/рћооеу/ апа ргзпт “ипрпооеу\п” 
}; 


Этот пример выведет “ипрпооеу”. Здесь їгу вызывается с двумя аргументами: ано- 
нимной функцией {01е “рпооеу”.} и значением, возвращаемым функцией саїсп, 
которым в данном случае оказывается ее первый аргумент — весь блок другой 
анонимной функции. Функция {гу вызывает первый аргумент-функцию в блоке 
еуа1, который перехватит ошибку, если она возникнет. В случае ошибки вызыва- 
ется вторая функция с локальной версией глобальной переменной $ , куда пред- 
варительно сохраняется возбужденное исключение. Если все это выглядит для 
вас полной тарабарщиной, почитайте о функциях (іе и еуа1 в главе 27, а затем об 
анонимных функциях и замыканиях в главе 8. Если же вас это заинтересовало, 
обратите внимание на модуль Тгу: Т1пу из СРАМ, где такая технология применяет- 
ся для реализации структурированной обработки исключительных ситуаций 
с использованием предложений їгу, саїсћ и Ғіпа11у. 


Вот новая реализация оператора дгер ВЕОСК? (встроенная функция, конечно, более 
эффективна): 


зиб тудгер (&6) { 
пу $содегеғ = ѕһіғ+; 


1 Да, остались нерешенными проблемы, связанные с областью видимости @ _. Но мы пока 


не будем затрагивать этот вопрос. 


2 Его невозможно реализовать в форме дгер ЕХРА. 


Прототипы 335 


му @ге»и1ї; 
гог му $_ (@ ) { 

розн (@гези1т, $ ) 1{ &$содегеЕ; 
} 


гетигп @гези т; 


} 


Кое-кто предпочел бы иметь полные буквенно-цифровые прототипы. Буквы и циф- 
ры намеренно выведены из прототипов с целью когда-нибудь ввести формальные 
именованные параметры. (Поживем -- увидим.) Основная задача имеющегося в на- 
стоящее время механизма состоит в том, чтобы дать создателям модулей возмож- 
ность до определенной степени проверять пользователей этих модулей. 


Встроенная функция ргоїоїуре позволяет извлекать прототипы пользователь- 
ских и встроенных функций; подробности читайте в главе 27. Чтобы изменить 
прототип функции «на лету», используйте функцию ѕеї ргоїоїуре из стандартно- 
го модуля Зса1аг::411. Например, если потребуется, чтобы функции М0 и №С из 
модуля Ип1соде: :№огта117е действовали подобно прототипу «_›, можно выполнить 
следующие операции: 


изе Џп1соое: :Могта1тхе ом(мЕО МЕС); 


ВЕСТМ { 
изе ЭсаТаг: :0+і1 "ѕеї _ргофофуре”; 
зе _рготофуре(\&МЕО => “_”); 
ѕеї_ргоїоёуре(\&МЕС => ”_”) 

} 


Подставляемые функции-константы 


Функции с пустым прототипом (), т.е. не принимающие никаких аргументов, 
интерпретируются аналогично встроенной функции *іпе. Что интересно, компи- 
лятор считает такие функции кандидатами на подстановку (іпіпіпе). Если после 
оптимизации и свертки констант результатом такой функции является констан- 
та или скаляр с лексической областью видимости без других ссылок, это значе- 
ние будет использоваться вместо вызова данной функции. Однако вызовы вида 
&МАМЕ никогда не преобразуются в подстановку и не подвержены другим эффек- 
там, связанным с прототипами. (Читайте описание прагмы сопѕїапї в главе 29, 
если вас интересует простой способ объявлять такие константы.) 


Обе следующие версии функций для вычисления числа л компилятор сделает 
подставляемыми: 


ѕир рі () { 3. 14159 } # Не точное значение, но близко к тому 
ѕир РТ () { 4 * аїап2(1, 1) } # Точно, насколько возможно 


Подстановка будет выполнена и для всех следующих функций, поскольку Рег! мо- 
жет определить возвращаемые этими функциями значения на этапе компиляции: 


зиб РАС РОО () {1<<8 } 
зи РАС ВАВ () (1 <<9 } 
иб ҒАЙ МАЅК ()  { РААб РОО | РІАб ВАН } 


ѕир ОРТ ОІАВСН () { (0х1В858 & РЕАб_МАЗК) == С } 
ѕиб СЕАВСН_ МАГ () { 
1Е (ОРТ СІААСН) { гетигп 23 } 
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е1$е { гебигт 42 } 
} 


ѕио М () { іпЕ(СІАВСН УА) /З } 

ВЕСІН { # компилятор выполнит этот блок на этапе компиляции 
пу $ргоб = 1; # сохраняющая значение локальная переменная 
Рог (1 №) { $ргод *= $_ } 
зуб МЕАСТ () { $ргод } 

} 


В последнем примере вместо функции МАСТ будет выполнена подстановка, пото- 
му что функция имеет пустой прототип, а возвращаемая переменная не изменя- 
ется функцией - более того, эту переменную в принципе нельзя изменить, по- 
скольку она находится в лексической области видимости. Поэтому компилятор 
заменит вызовы МГАСТ значением, вычисленным на этапе компиляции, раз декла- 
рация заключена в блок ВЕСІМ. 


Если переопределить функцию, которая имела возможность подстановки, Ре] 
обязательно предупредит об этом. (Благодаря данному предупреждению можно 
узнать, выполняет ли компилятор подстановку той или иной подпрограммы.) 
Данное предупреждение считается достаточно важным, чтобы его нельзя было 
отключить, так как ранее скомпилированные вызовы функции по-прежнему бу- 
дут использовать старое значение. Если позднее потребуется переопределить 
функцию, следует исключить возможность сделать ее подставляемой путем уда- 
ления прототипа () (что изменит семантику вызова, поэтому будьте осторожны) 
или помешать механизму подстановки иным способом, например: 


ѕир поё іп1іпеа () { 
гетигп 23 1? $$; 
} 


Более подробно о том, что происходит в фазах компиляции и выполнения про- 
граммы, читайте в главе 16. 


Предосторожности при использовании прототипов 


Вероятно, прототипы лучше применять к новым функциям, а нє прикручивать 
к уже существующим задним числом. Это шаблоны контекста, а не прототипы 
АМЗГ С, поэтому будьте внимательны, чтобы незаметно не изменить контекст. 
Предположим, что функция должна принимать только один параметр, как в сле- 
дующем примере: 
ѕиб Фипс ($) { 
ту $п = ЅһіЁЕ, 
ргіпё “вы передали мне $п\п“ 


} 


Это превращает функцию в унарный оператор (подобно встроенной функции гап) 
и изменяет порядок интерпретации аргументов функции компилятором. С но- 
вым прототипом функция принимает единственный аргумент в скалярном кон- 
тексте вместо многих аргументов в списочном контексте. Если она где-то вызыва- 
лась с массивом или списком, даже если этот массив или список содержали един- 
ственный элемент, то там, где она раньше нормально работала, теперь мы будем 
получать совершенно иные результаты: 
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Гипс @Гоо, # количество элементов @Тоо 

Типс 5р1іїТ /:/; # количество возвращаемых полей 

Ғипс “а”, ^6“, ; # передается только “а”, "р" и “с” отбрасываются 
Ғипс(^а", "0", *); —# внезапно: ошибка компилятора! 


“с- 
С 
Вначале списка аргументов неявно передается скаляр, что может оказаться, ска- 
жем мягко, несколько неожиданным. Прежний массив @Гоо, содержавший один 
элемент, не передается. Вместо него Гипс получит 1 (число элементов в @`:о). 
А 5р1ії при вызове в скалярном контексте испортит весь список параметров б . 
В третьем примере, поскольку Типс назначен прототип унарного оператора, пере- 
дано будет только “а”; а значение, возвращаемое Гипс, будет отброшено, потому 
что оператор «запятая» продолжит вычисление следующих двух элементов и вер- 
нет “с”. В последнем примере во время компиляции пользователь столкнется 
с синтаксической ошибкой там, где раньше ее не было. 


Если в новой программе потребуется создать оператор, принимающий только 
скалярную переменную, а не прежнее скалярное выражение. в прототипе можно 
указать, что функция принимает ссылки на скаляр: 


зиб Рипс (\$) { 
ту $пгеЁ = ѕһі?; 
ргіпі “вы передали мне $Фпгег\п”: 


} 


Теперь компилятор разрешит передавать лишь объекты, имена которых предва- 
ряются символом $: 


Ғипс @Гоо; # ошибка компиляции, есть @, нужен $ 

Ғипс 5р111/:/ # ошибка компиляции, есть функция, нужен $ 
Фипс $5; # здесь порядок -- получен символ $ 

Типс $а[3]; ви здесь 

Фипс ФА {зи} [-1]; # и даже здесь 

Фийс 2+5; # скалярное выражение, ошибка компиляции 
Типс ${ \(2+5) }; # порядок, нс это лекарство хуже болезни 


При неосторожном обращении прототипы могут стать источником неприятностей. 
Но при внимательном отношении с их помощью можно творить чудеса. Конечно, 
это сильное средство и пользоваться им надо с умом, чтобы сделать мир лучше. 


Прототипы встроенных функций 


Для справки в табл. 7.2 перечислены текущие прототипы встроенных функций 
у5.14, которые могут быть переопределены. 


Таблица 7.2. Прототипы встроенных функций 


Прототип | Ключевые слова 


() апа, бгеак, сопїіпие, дитр, епддгепї, епдһоѕтепї, епдпеїепї, епарготоепї, 
епармепі, епаѕегмепї, Ғогк, детдгепї, деїћоѕїепі, деі10діп, деїпеїепї, 
деїрріа, деєргоїоепт, деїрмепї, деїѕегмепї, ог. ѕеїдгепї. ѕеїрмепї. Тіпе. 
{1те$, маії, мапіаггау 


(_) абз, а1агт, сһг, сһгоої, соѕ, ехр, Тс, пех, іпї, 1с, 1сРігѕї, 1епдти, 109, осї. 
ога, диотетета, геаб1іпк, геайріре, геГ, гтӣіг, ѕіп, заг®, ис, исѓігэї 


(;$) са11ег, сһдіг, ехії, деїрдгр, дтЕ1те, 1оса1те, гапа, геѕеї, ѕ1еер, згапд, итазк 
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Таблица 7.2 (продолжение) 
Прототип | Ключевые слова 


(;=) с1оѕе, ео, деїс, геад11пе, ѕе1есї, 1е11, мгіїе 

(;+) рор, 5ћі?Е 

(@) сһтоа, сһомп, 91е, К111, гемегѕе, ип1іпк, иф1те, магп 

(_,$) пКаіг 

(;$$) зеёрдгр 

($) 9е19г919, детогпат, деїһоѕтругате, оеїпеїрупате, деїрготорупапе, 
деїргоїорупитбег. деїрмпат. деїомиій. ѕеїпоѕіепї, ѕеїпетепт, зетрготоепт, 
ѕеїѕегмепї 

(=) с10$е01г, Ғі1епо, деїреегпате. деїѕоскпате. 151аї, геадаіг, геміпдаіг, зтат. 
1е1191г 

(+) васһ, Кеуз, уа1иез 

(\$) 1оск 

(\%) дбтс105е 

(\[$6%*]) | +іеб, ипые 

($:$) р1еѕѕ. ипраск 

(*; $) 62.птоде 

(*; $6) ореп 

{+;$$@) $р11се 

($$) аїтап2, сгурї, деїһоѕтруадаг, деїпетбуаааг, одеїргіогіїу, детзегубупапе, 
деїѕегурурогЕ, 11пк, тѕддеї, гепате, ѕетор, ѕут1іпк, їгипсаїе. маіїріа 

($@) Ғогт1іпе, јоіп, раск, ѕргіпї?, зузса11 

(+0) риѕћ, ипѕһіғС 

(*$) ріпа, соппесї, Ғ1осК, 1іѕтеп, орепдіг ѕеекдіг, ѕһиїбом") 

(**) ассері, ріре 

($9; 9) 1пдех, гіпдех 

($$;$$) ѕибѕїг 

(*$;$$) ѕуѕмгіїе 

(\[Ф@%»+] $6) | іе 

($$$) т50с11, тѕдѕпа, зетдет, ѕетрг1ог1ту, ѕптсї1, ѕптдеї. мес 

(*$$) Ғспї1, деїѕоскорї, іосї1, зеек, зуззеек 

(\%$$) абтореп 

(«9$;$) зепа, зузореп 

(*\$$;$) геай, ѕуѕгеад 

(989$) зетс{1, эһтгеаа, эһтмгіїе 

(8$) ѕеїѕоскорї. ѕоскеї 

(*\$$$) гесу 

($$$$$) ШЕ 1497 

(**$$$) ѕоскеїраіг 
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Атрибуты подпрограмм 


С объявлением или определением подпрограммы можно связать список атрибу- 
тов. Разделителями в таком списке служат пробельные символы или двоеточия, 
и обрабатывается он так, как если бы была встречена инструкция изе аіігіриїеѕ. 
Подробнее о применении прагмы изе аїїгіриїеѕ рассказывается в главе 29. Есть 
два стандартных атрибута подпрограмм: пеїћой и 1уаше. 


Атрибут теќһоа 


Атрибут пеїћос может использоваться самостоятельно: 


ѕир аРипс . мефноа { } 


В настоящее время его действие сводится к подавлению вывода предупреждения 
"Атрідиоиѕ са1] гезо1\ед аз СОВЕ: :%5" (неоднозначный вызов разрешен как СОНВЕ::%5). 
(Возможно, когда-нибудь мы придадим ему дополнительный смысл.) 


Пользователь может расширять систему атрибутов, что дает возможность созда- 
вать собственные имена атрибутов. Новые атрибуты должны удовлетворять пра- 
вилам образования имен простых идентификаторов (никаких знаков пунктуа- 
ции, кроме символа « »). К ним может прилагаться список параметров, для кото- 
рого в настоящее время выполняется толькс проверка сбалансированности вло- 
женных скобок. 


Примеры допустимого синтаксиса (даже если атрибуты неизвестны): 


зуб Рпога (&\%) — эм1ЕсН(10, Р00(7,3)) . ехрепѕіме 
зиб р1идн () : Ч91у( `\(") :Ва9; 
ѕир ху22у : _5х5 {... } 


Примеры неправильного синтаксиса: 


ѕир Рпог@ ѕміїсћ( 10, Ғоо(); ў непарные скобки 
ѕиб ѕпоіа : 091у(`(`); # непарные скобки 


ЗИ6 ху72у : 5х5; # "5х5" не является идентификатором 
зиб р1идй : \2: : погїћ; # "Ү2::погЕћ” не является простым идентификатором 
ѕир ѕпигЕ : Роо + баг; # "+ не является двоеточием или пробелом 


Список атрибутов передается в код, который связывает их с подпрограммой, как 
список строковых констант. Точное представление о том, как он работает (или не 
работает), можно получить экспериментальным путем. Текущее состояние дел со 
списками атрибутов и обработкой таких списков можно получить изайитфвщез(3). 


Атрибут аше 


Подпрограмма может возвращать модифицируемое скалярное значение, но толь- 
ко если объявить, что она возвращает 1-значение: 


ту $\а1; 
зиб саптоа . 1ма1ие { 
$\а1; 
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ѕир потоб { 
$\а1; 


сапто@() = 5; # присваивание переменной $уа1 
потой() = 5; # ОШИБКА 


При передаче параметров подпрограмме, возвращающей 1-значение, обычно нуж- 
ны скобки для устранения неоднозначности типа присваиваемого значения: 


саптой $х = 5; # сначала присвоит переменной значение 5 переменной $х: 


саппой 42 = 5; # нельзя изменить константу - ошибка компиляции 
саптод($х) = 5; # здесь все в порядке 
саптод (42) = 5; # и здесь тоже 


Эту особенность можно обойти, если подпрограмма принимает всего один аргу- 
мент. Когда функция объявлена с прототипом ($), на этапе синтаксического ана- 
лиза она получит приоритет именованного унарного оператора. Поскольку име- 
нованные унарные операторы имеют более высокий приоритет, чем присваива- 
ние, надобность в скобках отпадает. (Целесообразность этого оставим определять 
полиции стилевых нравов.) 


Если подпрограмма не имеет аргументов (т.е. ей назначен прототип ()), можно, не 
вызывая неоднозначности, сказать: 


саппоа = 5; 


Это допустимо, потому что терм не может начинаться с символа =. Аналогично 
можно опускать скобки в вызовах методов, возвращающих 1-значение, если им не 
передаются аргументы: 


$орј->сапптоа = 5; 


Обещаем, что эти две конструкции сохранятся в будущих версиях Рег.. Они удоб- 
ны, когда нужно обернуть (мгар) атрибуты объекта вызовами методов (чтобы их 
можно было наследовать, как методы, но обращаться, как к переменным). 


Скалярный или списочный контекст подпрограммы, возвращающей 1-значение, 
и правой части выражения присваивания определяется так, как если бы вызов 
подпрограммы был заменен скаляром. Например: 


даїа(2,3) = деї да+а(3, 4); 

Здесь обе подпрограммы вызываются в скалярном контексте, в то время как здесь: 
(дата(2,3)) = бет аата(3, 4); 

и здесь: 
(дата(2), йата(3)) = деї да+а(3, 4); 


все подпрограммы вызываются в списочном контексте. 


В текущей реализации из подпрограмм с атрибутом 1уа1ие нельзя возвращать 
массивы и хеши непосредственно, зато всегда можно вернуть ссылку. 


Ссылки 


По причинам как практическим, так и философским, Ре! всегда тяготел к пло- 
ским, линейным структурам данных. А для многих задач именно это и требуется. 


Допустим, требуется построить простую таблицу (двумерный массив) с антропо- 
метрическими данными - возраст, цвет глаз и вес – для группы людей. Для этого 
можно сначала создать массивы, соответствующие отдельным людям: 


@јоһп = (47, “темно-карие”, 186); 
@тагу = (23, “карие” 128); 
66111 = (35, “голубые”, 157); 


Затем — один общий массив с именами остальных массивов: 
@у1та15 = ( Јоһп , магу, 0111°); 


Чтобы изменить цвет глаз Джона на «красные» после ночи, проведенной в увесе- 
лительных заведениях, надо иметь возможность изменить содержимое массива 
ё@јоһп, используя только простую строку “)ойп”. Это основная проблема косвенной 
адресации (іпӣігесііоп), которая в разных языках решается по-разному. В языке С 
преобладающей формой косвенной адресации является указатель, который по- 
зволяет хранить адрес одной переменной в другой. В Рег! преобладающей формой 
косвенной адресации является ссылка (гејегепсе). 


Что такое ссылка? 


В нашем примере $у1їа15[0] имеет значение "јоћп". То есть данный элемент содер- 
жит строку имени другой (глобальной) переменной. Мы говорим, что первая пере- 
менная ссылается на вторую, и эта ссылка называется символической (зутфой‹), 
поскольку Рей приходится искать @]ойп в таблице символов. (Символические 
ссылки на переменные аналогичны символическим ссылкам в файловой систе- 
ме.) О символических ссылках мы будем говорить далее в этой главе. 


Ссылки второго типа называются жесткими (Вага), именно их чаще всего приме- 
няют программисты на Ре! для решения задач косвенной адресации (иногда с не 
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очень приятными последствиями). Жесткими мы называем их потому, что они 
надежные и прочные, а не потому, что с ними сложно обращаться. Если хотите, 
жесткие ссылки можно считать настоящими ссылками, а символические — под- 
дельными. Разница такая же, как между настоящей дружбой и похвальбой зна- 
комством с известным человеком. Если мы не уточняем, какую ссылку имеем 
в виду, речь идет о жесткой ссылке. На рис. 8.1 изображена переменная $%баг, ссы- 
лающаяся на скаляр с именем $Гоо и значением “Бот”. 


Рис. 8.1. Жесткая ссылка и символическая ссылка 


В отличие от символических ссылок, настоящая ссылка ссылается не на имя пе- 
ременной (которое просто хранит значение), а на фактическое значение, некото- 
рый внутренний фрагмент данных. Подходящего слова для него нет, поэтому мы 
называем его объектом ссылки (ге]егеп®. Предположим, что создана жесткая 
ссылка на массив @аггау, имеющий лексическую область видимости. Как эта же- 
сткая ссылка, так и соответствующий ей объект ссылки будут существовать, да- 
же когда @аггау выйдет из области видимости. Объект ссылки уничтожается, 
только когда ликвидированы все ссылки на него. 


Объект ссылки не имеет собственного имени как такового, существуют только 
ссылки на этот объект. Если посмотреть на это иначе, то имя каждой переменной 
Рей «проживает» в той или иной таблице имен и соответствует ровно одной жест- 
кой ссылке на связанный с этим именем (и в других отношениях безымянный) 
объект ссылки. Объект ссылки может быть простым значением, как число или 
строка, или сложным – как массив или хеш. В любом случае переменную с ее 
значением связывает ровно одна ссылка. На тот же объект ссылки можно создать 
другие ссылки, но переменная не будет об этом знать (или беспокоиться).! 


Символическая ссылка — это простая строка, служащая именем некоторого эле- 
мента таблицы имен в пакете. Это не столько какой-то особый тип, сколько спо- 
соб обращения со строкой. Но жесткая ссылка – это зверь совсем иной породы. 
Это третья разновидность фундаментальных скалярных типов данных (два дру- 
гих — строки и числа). Чтобы ссылаться на объект, жесткой ссылке не нужно 
имя, и, самое главное, совершенно нормально, если такого имени вообще нет. 
Такие совершенно безымянные объекты ссылок называются анонимными; мы 
расскажем о них далее, в разделе «Анонимные данные». 


1 Если вам это интересно – прочитать счетчик ссылок для объекта можно с помощью мо- 
дуля 0еуе1::Реек, поставляемого с Рег]. 
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В терминологии данной главы, чтобы сослаться (ѓо ге{егепсе) на значение, нужно 
создать на него жесткую ссылку. (Этот акт созидания выполняет специальный 
оператор.) Созданная при этом ссылка является простым скаляром, который ве- 
дет себя как любой другой скаляр. Разыменовать (4еге]егепсе) этот скаляр озна- 
чает использовать ссылку для доступа к объекту ссылки. Как создание ссылки, 
так и разыменование происходят только при явном обращении к определенному 
механизму; неявное создание и разыменование ссылок в Регі 5 никогла не проис- 
ходит. Ну, почти никогда.! 


При вызове функции может использоваться семантикг неявной передачи по 
ссылке, если эта семантика определена в прототипе. В таком случае ссылка пере- 
дается функции неявным образом, но разыменовывать ее внутри функции прихо- 
дится явно. См. раздел «Прототипы» в главе 7. И, если уж говорить совсем честно, 
неявное разыменование ссылок все-таки случается, когда используются некото- 
рые виды дескрипторов файлов, но это делается для поддержки обратной совмес- 
тимости и происходит прозрачно для обычного пользователя. Две встроенные 
функции, 01е5$ и 10ск, принимают в качестве аргумента ссылку и неявно разыме- 
новывают ее, чтобы творить волшебство над объектом этой ссылки. И, наконец, 
начиная с Ре! версии у5.14, встроенные функции, оперирующие массивами и хе- 
шами?, теперь принимают ссылки на объекты соответствующих типов и авхома- 
тически разыменовывают их при необходимости. Но если оставить в стороне эти 
признания, то базовый принцип все же состоит в том, что Рег! воздерживается от 
участия в иерархии косвенной адресации, созданной программистом. 


Ссылка может указывать на любую структуру данных. Поскольку ссылки явля- 
ются скалярами, их можно сохранять в массивах и хешах, создавая тем самым 
массивы массивов, массивы хешей, хеши массивов, массивы хешей и функций 
ит.д. Примеры тому есть в главе 9. 


Но имейте в виду, что внутреннее представление массивов и хешей в Рег! являет- 
ся одномерным. То есть, их элементы могут хранить только скалярные значения 
(строки, числа и ссылки). Под термином «массив массивов» мы подразумеваем 
«массив ссылок на массивы», так же как, говоря «кеш функций», мы в действи- 
тельности имеем в виду «хеш ссылок на подпрограммы». А раз в Ре] ссылки яв- 
ляются единственным способом реализации подобных структур, то более корот- 
кий, но менее точный термин не настолько неточен, чтобы быть неверным, пото- 
му не следует его отвергать, если только вы не придаете особого значения такого 
рода вещам. 


Создание ссылок 


Есть несколько способов создания ссылок, и мы опишем большинство этих спо: 
собов, прежде чем объясним, как использовать (разыменовывать) полученные 
ссылки. 


1 Чтобы запутать вас еще больше, скажем, что в Рег] 6 это происходит практически всегда. 


2 Кеуѕ, ма1шез, еасп, рор, ризй, ћіѓТ, ипзћ1ѓї и зр1асе. 
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Оператор обратной косой черты 


Ссылку на любую именованную переменную или подпрограмму можно создать 
с помощью обратной косой черты. (Ее можно также использовать с анонимными 
скалярными значениями, например 7 или "сате]", но это редко когда пригождает- 
ся.) Этот оператор действует подобно оператору & (взятие адреса) в С, по крайней 
мере, на первый взгляд. 


Вот несколько примеров: 


$эса1аггеЕ = \$ғос; 
фсопѕігеЕ = \186_282.42; 
фаггаугег = \@АВС\; 
фпазпие = \ЕМ№; 
$содеге? \&һапа1ег; 
$91обге? = \+5Т000Т: 


Оператор обратной косой черты может сделать больше, чем просто создать одну 
ссылку. Если применить его к списку, он создаст целый список ссылок. Подроб- 
ности читайте в разделе «Другие приемы использования жестких ссылок». 


Анонимные данные 


В примерах выше оператор обратной косой черты просто создаєт дубликаты ссы- 
лок, уже связанных с именами переменных, за одним исключением: 186_282.42 яв- 
ляется простым значением, а не именованной переменной. Этс пример одного из 
вышеупомянутых анонимных объектов ссылки. Доступ к анонимным объектам 
ссылки осуществляется только с помощью ссылок. Данный объект представляет 
собой число, но можно также создать анонимный массив, хеш и подпрограмму. 


Формирование анонимных массивов 
Ссылку на анонимный массив можно создать с помощью квадратных скобок: 
$аггаугеғ = [1, 2, [Га , `6, ‘© 91]; 


Здесь сформирован анонимный массив из трех элементов, последний из которых 
является ссылкой на анонимный массив с четырьмя элементами (как изображено 
на рис. 8.2). (Для доступа к этим элементам можно использовать синтаксис мно- 
гомерных массивов, описываемый ниже. Например, выражение $аггауге!->[2][1] 
вернет значение `|`.) 


Ѕагггаугеї 


Рис. 8.2. Ссылка на массив, третий элемент которого является ссылкой на массив 


Создание ссылок ‹ 345 


Теперь у нас есть способ представить таблицу, приведенную в начале главы: 


$тар1е = [ [ “јоһп”, 47, “темно-карие“, 186], 
[ "тагу", 23, карие”, 128], 
[ “6211”. 35, “голубые”, 157] 1; 


Квадратные скобки действуют подобным образом только там, где анализатор Рег] 
предполагает наличие терма в выражении. Не следует путать их с квадратными 
скобками в таких выражениях, как $аггау[6], хотя мнемоническая ассоциация 
с массивами является намеренной. Внутри строки, заключенной в двойные ка- 
вычки, квадратные скобки не образуют анонимных массивов, а становятся лите- 
ральными символами строки. (Квадратные скобки все же действуют, когда обо- 
значают индексы массивов в строках, иначе нельзя было бы выводить строковые 
значения, такие как “\/А!=$аггау[6]\п". И если уж совсем откровенно, формирова: 
ние анонимных массивов все же можно протащить в строки, но только если они 
встроены в более сложные выражения, которые подвергаются интерполяции. 
К этой замечательной возможности мы еще вернемся в этой главе, поскольку для 
ее применения требуется как создание ссылок, так и разыменование оных.) 


Формирование анонимных хешей 


Ссылку на анонимный хеш можно создать с помощью фигурных скобок: 


фһаѕһгеғ = { 
"Адам" => "Ева", 
“Клайд” => $боппіе, 
“Антоний” => "Клео" . "патра", 


} 


В значениях хеша (но не в ключах) можно смело смешивать формировать другие 
анонимные массивы, хеши и подпрограммы, создавая сколь угодно сложные 
структуры. 

Теперь у нас есть еще один способ представить таблицу. приведенную в начале 
главы: 


фтаб1е = { 
"јоһп” => [ 47, “темно-карие” 186 ], 
“пагу” => [ 23, “карие”, 128 ], 
“6111” => [ 35 “-олубые” 157 ], 


№ 


Это хеш массивов. Выбор наиболее уместной структуры данных — дело непро- 
стое, и этому вопросу посвящена следующая глава. В качестве рекламы пока- 
жем, как создать хеш хешей для представления нашей таблицы: 


фтаб1е = { 
“]ойп” => { аде => 47, 
еуеѕ => “темно-карие”, 
меіоһі => 186 
}, 
“тагу” => { аде => 23, 
еуеѕ => “карие”, 
меіоћі => 128 
}, 
“2111” => { аде => 35, 
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еуеѕ => "голубые", 
меідһі => 157, 


}; 


Фигурные скобки, как и квадратные, имеют специальное значение только там, 
где анализатор Рей предполагает наличие терма в выражении. Не следует путать 
их с фигурными скобками в выражениях вида $һаѕһ{кеу} – хотя мнемоническая 
ассоциация с массивами и в этом случае является намеренной. При использова- 
нии фигурных скобок в строках действуют тє же правила. 


Есть еще одно правило, не распространяющееся на квадратные скобки. Посколь- 
ку фигурные скобки используются также для других целей (в том числе для раз- 
граничения блоков), иногда приходится устранять неоднозначность фигурных 
скобок в начале оператора, помещая перед ними + или гефигп, чтобы Рей понял, 
что открывающая скобка не начинает блок. Например, чтобы функция создала 
новый хеш и вернула ссылку на него, можно использовать такие варианты: 


зиб пазпет { ге } } # НЕВЕРНО, просто вернет @_. 
зиб һаѕһет { + @е } } вок. 
ѕир һаѕһет { гефигп { @_ } } #0К. 


Формирование анонимных подпрограмм 


Создать ссылку на анонимную подпрограмму позволяет объявление 516 без име- 
ни подпрограммы: 


ФсодегеЕ = зиб { ртіп "Воіпк! \п” }; # вызов &фсодеге? выведет “Во1пк!“ 


Обратите внимание на точку с запятой, которая требуется для завершения выра- 
жения. (Точка с запятой не обязательна после более распространенной формы 
объявления и определения именованной подпрограммы, 506 МАМЕ {}.) Объявление 
зир {} без имени является не столько объявлением, сколько оператором – как {} 
или е\а! {} — за исключением того, что код внутри блока не выполняется немед- 
ленно. Вместо этого генерируется ссылка на код – в нашем примере эта ссылка 
сохраняется в $сойегеѓ. Но сколько бы раз ни выполнялась приведенная выше 
строка, $содегеѓ будет ссылаться на одну и ту же безымянную процедуру. 


Конструкторы объектов 


Подпрограммы также могут возвращать ссылки. Может звучать банально, но 
иногда мы обязаны использовать подпрограммы для создания ссылок, а не созда- 
вать их напрямую. В частности, особые подпрограммы, называемые конструкто- 
рами, создают или возвращают ссылки на объекты классов. Объект класса — это 
просто ссылка особого типа, связанная с определенным классом, и конструкторы 
умеют создавать эту связь. Они берут обычный объект ссылки и превращают его 
в объект класса с помощью оператора 61е5$, поэтому можно считать, что объект 
класса — это «освященная ссылка» (Ыеѕѕеа геѓегепсе). Ничего религиозного в этом 
нет. Поскольку класс – это тип, определяемый пользователем, обработка объекта 


' Анонимная подпрограмма только одна, однако она может использовать несколько на- 


боров лексических переменных — в зависимости от того, когда генерируется ссылка на 
подпрограмму. О таких наборах мы расскажем далее, в разделе «Замыкания». 
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ссылки с помощью 01ез$ просто делает его экземпляром типа, определенного 
пользователем. Конструкторам часто дают имя пем — особенно программисты на 
языках С++ и Јауа - но в Ре! их можно называть как угодно. 


Конструкторы можно вызывать любым из следующих способов: 


фобјгеѓ = боддіе::->пем(Таі1 => ‘короткий’, Еагѕ => ‘длинные ) #1 


фобјге? = пем 00091е:: Та{1 => ‘короткий’, Еагѕ => ‘длинные’; #2 
форјгеғ = 00901е->пем(Та11 => ‘короткий’, Еагѕ => ‘длинные’); #3 
$06] геЁг = печ 0оддіе Та11 => ‘короткий`, Еагѕ => ‘длинные’: #4 


Первый и второй способы одинаковы. Оба вызывают функцию пем из модуля 
Оо0д1е. Третий и четвертый способы действуют так же, как первые два, но они не- 
сколько двусмысленны: анализатор запутается, если определить собственную 
подпрограмму с именем 0000іе. (Поэтому в именах подпрограмм обычно придер- 
живаются символов нижнего регистра, а символы верхнего регистра используют 
в именах модулей.) Четвертый способ также приведет к путанице, если опреде: 
лить собственную подпрограмму пем и не выполнить операторы геди1ге или изе 
для модуля 00901е, каждый из которых имеет эффект объявления модуля. Всегда 
объявляйте свои модули, если хотите пользоваться вариантом 4. (И остерегай- 
тесь «бродячих» подпрограмм [00001е.) 


Объектам Ре! посвящена глава 12. 


Ссылки на дескрипторы 


Ссылки на дескрипторы файлов или дескрипторы каталогов можно создавать, 
ссылаясь на фуреё10Ъ с такими же именами: 


ѕр1оїтег(\ «5Тро0Т); 


ѕир эр1иттег { 
пу ФЕИ = ЅҺІҒ+; 
зау $#һ “пег им ме11 а һәтт”; 


$гес = деї_гес(\*5Т0ІМ); 
зуб деї гес { 
ту ФЕВ = эт Е; 
геёигп ѕса1аг <Ф?һ>: 


} 


Для передачи дескрипторов файлов можно применять голые (простые) фуреё]1оБ: 
в примере выше вместо \+5Т000Т и \*ЭТОТМ можно было бы использовать *5ТО0Т или 
*5ТрІМ. 


Хотя фуреё1оь и ссылки на ёурев1ор обычно можно использовать взаимозаменяе- 
мо, в некоторых случаях это недопустимо. Простые фуреЕ10ь нельзя катапульти- 
ровать в царство объектное посредством 01655, а ссылки на ёурее1оЬ нельзя вер- 
нуть из области видимости локализованного ќурее1ор, 


Раньше использовался следующий прием создания новых дескрипторов файлов 
при открытии файлов по списку: 


Гог фҒіЛе (@патеѕ) { 
1оса1 *РН; 
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ореп(*ЕН, $Е11е) || пехї; 
фһап01е{$#11е} = «РН; 
} 


Такой подход по-прежнему в силе, но часто разумнее позволить неопределенной 
переменной автоматически «оживить» анонимный іурер]об, т.е. выполнить ав 
товивификацию!: 


Гог $Ғі1е (@патез) { 
ту ФП, 
ореп($#һ, $111е) || пехт; 
$һапо1е{$#і1е} = $11; 

} 


Всякий раз, когда вместо простого дескриптора файла используется переменная, 
содержащая дескриптор, создается косвенный дескриптор. Не имеет значения, 
что вы используете: строки, ѓурееоЬ, ссылки на фуреР10Ъ или более экзотические 
объекты ввода/вывода. Вы просто используете скаляр, который так или иначе 
будет интерпретирован в качестве дескриптора файла. В большинстве случаев 
почти не имеет значения, что выбрать — фуреё10Ь или ссылку на фурег]оЪ. Как уже 
отмечалось выше, при этом включаются определенные волшебные механизмы 
неявного разыменования. 


Ссылки на таблицы символов 


В редких случаях тип требуемой ссылки может быть неизвестен во время написа- 
ния программы. Такую ссылку можно создать с помощью особого синтаксиса, ко- 
торый ласково называют синтаксисом *Гоо{7Н1}. Выражение вида *Роо{ТНГМС} 
возвращает ссылку на элемент ТНІМС в *Гоо,? который является записью в таблице 
имен, содержащей значения $00, @ѓоо, %Гоо сотоварищи. 


$эса1агге! = *«Ғоо{$САГАҢ}; # То же, что и \$Ғоо 
фаггаугеҒ = *«АВС\У{АВВАУ}; # То же, что и \@АЯбУ 


фһаѕһгеғ# = *ЕМУ{НАЅН}; # То же что и \%ЕМУ 
фсобеге?ї = *һапд1ег {СОВЕ}; # То же, что и \&папо1ег 
$91о6гег = *ѓоо{610В}, # То же что и \*100 
фіоге? = «ТІМ ІО}; # Э-э 


фҒогтаге? = *«Роо{ЕОВМАТ}; й И снова э-э. . 


Здесь все ясно без объяснений, за исключением последних двух строк. *Гоо{РОНМАТ} 
возвращает объект, объявленный с помощью оператора ѓогпаї. Такая ссылка не 
представляет особого интереса. 


А вот *5Т0ІМІ0} возвращает фактический внутренний объект 10::Напд1е, храня- 
щийся в фуре?1оь, т.е. ту часть фуреё1оЪ, которая представляет немалый интерес 
для различных функций ввода/вывода. Для совместимости с ранними версиями 
Рег! обозначение +Гоо{ЕТ1ЕНАМОЕЕ} когда-то служило синонимом более привычного 
х100{10}, но в настоящее время использовать его не рекомендуется. 


1 Автовивификация — отличительная особенность языка Рег], связанная с динамиче- 
ским конструированием структур данных. – Прим. науч. ред. 


Развернутое толкование и историю термина «#00» можно найти в словаре сленга Јагвоп 
Е1Пе (ВЕр://шшидагаопаФ.от8/). – Прим. ред. 
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Теоретически *«НАМО!Е{Т0} можно использовать везде, где допустимы *НАМО:Е или 
\»*НАМОЕЕ, например для передачи дескрипторов в подпрограмму или из нее или для 
сохранения в более развитых структурах данных. (На практике все же есть неко- 
торые шероховатости, которые предстоит сгладить.) Преимущество таких ссылок 
заключается в том, что они ограничивают доступ лишь интересующими вас объ- 
ектами ввода/вывода, исключая риск затереть другие данные ѓуреғв1оБ, присвоив 
значение по їурев1ођ-ссылке (хотя если всегда выполнять присваивание скаляр- 
ной переменной, а неіурес1оЬ, все будет в порядке). Есть и недостатки — скажем, на 
сегодняшний день нет механизма автовивификации для таких ссылок.! 


ѕр1џїтег( «$7000Т): зр1иї+ег( «5Т000Т(10}): 


зир ѕр1иттег { 
ту $#һ = ЅҺіРЕ; ртіп ФЕИ “һег ит ме11 г ћттт\п”; 
} 


Оба вызова ѕр1иїтег() выведут "һег ит ме11 а һттт”. 


Конструкция *Ѓоо{ТАІМО)} возвращает ипіеї, если компилятор еще не встречал ука- 
занный аргумент ТН, кроме случаев, когда ТНІМб представляет собой САГАЯ. Де- 
ло в том, что «Ѓоо{5САГАВ} возвращает ссылку на анонимный скаляр, даже если 
компилятор еще не встречал $ѓоо. (Рег всегда добавляет скаляр к любому їурев1об 
для оптимизации кода по размеру. Но не следует полагать, что так будет и в по- 
следующих версиях.) 


Неявное создание ссылок 


Выше вы видели некоторые замысловатые примеры автовивификации - и это 
последний метод создания ссылок, который, в сущности, методом не является. 
Ссылки нужного типа просто возникают при разыменовании их в контексте 
1-значения, предполагающего их существование. Это очень удобно и это как раз 
ожидаемое поведение. Мы еще вернемся к этой теме далее в этой главе, когда речь 
пойдет о разыменовании созданных ссылок. Кстати, похоже, что мы как раз доб- 
рались до этого места. 


Использование жестких ссылок 


Сиособов использования, или разыменования (дегејегепсе), ссылок ничуть не 
меньше, чем способов их создания. Есть только один главный принцип: Рей не 
создает и не разыменовывает ссылки неявно.? Если скаляр содержит ссылку, он 
ведет себя как простой скаляр. Он не начинает чудесным образом вести себя как 
массив, или хеш, или подпрограмма: об этом ему нужно сказать явно, путем ра- 
зыменования. 


1 Внастоящее время ореп пу $11 автовивифицирует $уре 18, а не объект 10: :Напо1е, но ко- 
гда-нибудь мы, возможно, исправим это, поэтому не следует ориентироваться на суще- 
ствующее положение дел и считать, что автовивифицированный функцией ореп объ- 
ект – обязательно фуре]оЪ. 


Мы уже признавались, что это маленькая ложь, и повторяться не будем. 
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Использование переменной 
в качестве имени переменной 


Встретив скаляр, скажем $100, следует размышлять о нем, как о «скалярном зна- 
чении имени ѓоо». То есть где-то в таблице имен содержится запись Гоо, а разыме- 
новывающий символ $ ($121) дает возможность увидеть скалярное значение в ней. 
Если это значение является ссылкой, можно посмотреть, что находится по этой 
ссылке, предварив обращение к скаляру еще одним разыменовывающим симво- 
лом (т.е. разыменовав $100). Или, если посмотреть на это с другой стороны, можно 
заменить литерал Гоо в скаляре $ѓоо скалярной переменной, указывающей на 
фактический объект ссылки. Это верно для переменной любого типа, т.е. $$100 
является скалярным значением, на которое ссылается $ѓоо, @$фбаг — массивом, на 
который ссылается $Фбаг, %$01агсһ – хешем, на который ссылается $01агсћ, и т.д. 
Таким образом, перед любой простой скалярной переменной можно поместить 
дополнительный разыменовывающий символ и разыменовать ее: 


$Роо = "трехгорбый”; 
$эса}агге! \$#ғоо; # Фѕса1агге? теперь ссылка на $Роо 
$сате] тоде1 = $$зса1аггеЕ; # $сате1 тоде1 теперь”трехгорбый" 


Еще несколько примеров разыменования: 


$Баг = $%са1агге?; 


ризп(@фаггаугеЕ, $Ғі1епате); 
$Фаггауге [0] = “Јапџагу"; # Изменит первый элемент @$аггаугеЁ 
фаггауге! [4..6] = ом/Мау Јипе Ји1у/; # Изменит несколько элементов @фаггаугеѓ 


Жфһаѕһгеғ = (КЕҮ => "ЗВЕНИТ", ВІВО => "ПОЕТ" ); # Инициализирует весь хеш 
$$һаѕһгеғ{КЕҮ} = "ЗНАЧЕНИЕ"; # Изменит одну пару ключ/значение 
@фһаѕћге?{ "КЛЮЧ1", "КЛЮЧ2" } = ("ЗНАЧ1”, "ЗНАЧ2”); # Изменит еще две пары 


&Фсодегеї( 1,2,3); 


зау $һапа1егеғ "вывод"; 


Эта форма разыменования может применяться толькок простым скалярным пере- 
менным (без индексов). Это значит, что разыменование выполняется до (имеет бо- 
лее высокий приоритет) поиска в массиве или хеше. Попробуем с помощью фигур- 
ных скобок пояснить, что мы имеем в виду: выражение $$аггаугеї[0] эквивалент- 
но ${Фаггауге [0] и возвращает первый элемент массива, на который ссылается 
$аггаугеї. Это совсем не то же самое, что выражение ${$аггауге![0]}, разыменовы- 
вающее первый элемент (вероятно, несуществующего) массива с именем баггаугеї. 
Аналогично, выражение $$һаѕһгеЁ{КЕҮ} эквивалентно ${$пазНге!}{КЕ\}, и не имеет 
отношения к выражению ${$һаѕһгейКЕҮ})}, разыменовывающему элемент (вероят- 
но, несуществующего) хеша с именем Хћаѕћ'"еѓ. Не видать вам счастья, пока вы 
этого не поймете. 

Комбинируя разыменовывающие символы, можно работать на различных уров- 
нях иерархии ссылок и разыменований. Следующий пример выведет “Помду” 


$гегеР гей = \\\”һомду”; 
ргіпі $%%%геѓгеѓгеѓ?; 
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Можно считать, что знаки доллара действуют справа налево. Но в начале цепоч- 
ки все же должна быть простая скалярная переменная без индекса. Есть, правда, 
более замысловатый способ, которым мы уже тайком пользовались выше и о ко- 
тором расскажем в следующем разделе. 


Использование блока в качестве имени переменной 


Разыменовывать можно не только имя простой переменной, но и содержимое бло- 
ка. Всюду, где буквенно-цифровой идентификатор играет роль имени переменной 
или подпрограммы, его можно заменить блоком, возвращающим ссылку подхо- 
дящего типа. Иными словами, все приведенные выше примеры можно избавить 
от двусмысленности следующим образом: 


$баг = ${$зса1агге!}; 

риѕћ(@{$аггаугеғ}, $Е11епате); 

${Фаггаугег} [0] = “Запиагу”; 

@{фаггаугег} [4..6] = ом/Мау Јипе Ји1у/; 
${$һаѕһге?} {“КЕУ"} = "ЗНАЧЕНИЕ"; 
@{$пазнгет } { “КЛЮЧ”, "КЛЮЧ2"} = (“ЗНАЧТ” , "ЗНАЧ2"); 
&{Фсодеге!}(1,2,3), 


не говоря уже о: 


фгеғгеғге? = \\\"һомду”; 
ргіпі $(9(Ф{ФгеҒгеѓге?}) } 


В таких простых примерах глупо использовать фигурные скобки, но блок может 
содержать произвольные выражения и, в частности, выражения с индексами. 
В следующем примере предполагается, что $0іѕраїсћ{$ілдех} содержит ссылку на 
подпрограмму (такие ссылки иногда называют «соЧеге» — ссылкой на код). Под- 
программа вызывается с тремя аргументами; 


&{ $0іѕраїтсћ{$іпдех} }(1, 2, 3); 


Здесь блок необходим. Без внешней пары фигурных ссылкой на код будет счи- 
таться $0ізраїсћ, а не $91зратсн{$1п4ех}. 


Использование оператора «стрелка» 


Третий способ разыменования, с использованием инфиксного оператора ->, пред- 
назначен для ссылок на массивы, хеши или подпрограммы. Эта форма служит 
упрощению синтаксиса доступа к элементам массивов и хешей, а также косвен- 
ного вызова подпрограмм. 


Тип разыменования определяется правым операндом, т.е. тем, что следует непо- 
средственно за стрелкой. Если за стрелкой следует квадратная или фигурная скоб- 
ка, левый операнд считается ссылкой на массив или хеш, соответственно, а выра- 
жение справа – индексом. Если за стрелкой следует круглая скобка, то левый опе- 
ранд считается ссылкой на подпрограмму, которая должна вызываться с парамет- 
рами в круглых скобках справа. 

Операторы в каждой из следующих триад эквивалентны между собой и соответ- 
ствуют трем типам обозначений, с которыми мы познакомилисе. (Эквивалент. 
ные элементы выровнены при помощи пробелов.) 
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$ Фаггаугег [2] = "”Ооғіап”; #1 
${ $аггаугеғ }12] = “Оогіап"; #2 
$аггаугеғ-2[2] = "Оо‹іап", 83 


$ Фпазпгег {КЕҮ) = "Е#тајог”; #1 
${ $һаѕһгеғ }{КЕҮ} Еётадог”; #2 
Фһаѕһгеғ->{КЕҮ)} = "Ейтајог” #3 


н 


& ФсодегеРг (Ргезфо => 192), #1 
&{ $содегеЕ }(Ргезто => 192); #2 
$содегеғ->(Ргеѕ+о => 192); ГК) 


Можно заметить, что начальный разыменовывающий символ отсутствует в треть- 
ей форме записи каждой тройки. Рен угадывает начальный символ, и потому его 
нельзя использовать для разыменования целых массивов, целых хешей или их 
срезов. При работе же со скалярными значениями слева от оператора -> можно 
расположить любое выражение, в том числе другое разыменование, поскольку 
операторы стрелки связываются слева направо: 


ргіпї $аггау[3]->{°Епд1іѕћ”}->[0]; 


Из этого выражения можно заключить, что четвертый элемент баггау должен 
быть ссылкой на хеш, а значением элемента "Епо11ѕћ" в этом хеше должна быть 
ссылка на массив. 


Обратите внимание, что $аггау| 3] и $аггау->[3] – это разные вещи. В первом случае 
речь идет о четвертом элементе массива @аггау, а во втором — о четвертом элементе 
массива (возможно, анонимного), ссылка на который содержится в Фаггау. 


Предположим теперь, что элемент $аггау[3) не определен. Следующая инструк- 
ция все же допустима: 


фаггауЕ3 ]->{"Епо1іѕһ” }->[0] = “уапиагу 


Это один из тех упоминавшихся выше случаев, когда ссылка создается (автовиви- 
фицируется) при использовании в качестве 1-значения (т.е. в момент, когда ей при- 
сваивается значение). Если элемент $а: гау[3] прежде был неопределен, он автома- 
тически определяется как ссылка на хеш, и в него можно поместить значение 
$аггау[3]->{"Епо11ізћ”}. После этого элемент $аггау[3]->{`Епд1151`} автоматически оп- 
ределяется как ссылка на массив и можно что-нибудь присвоить первому элемен- 
ту этого массива. Обратите внимание, что для г-значений дело обстоит несколько 
иначе: ргіпї $аггау[3]->{"Епд11ѕћ")->[0] определит только $аггау[3] и $аггау[3]-> 
{`Епо1ізћ”), но не $аггау[3]->{`Епд115ћ"}->[0], потому что последний элемент не явля- 
ется 1-значением. (Автовивификацию первых двух элементов в контексте г значе- 
ния вообще можно считать ошибкой. Вероятно, мы ее когда-нибудь исправим.) 


Стрелку между квадратными или круглыми скобками либо между закрываю- 
щей квадратной или фигурной скобкой и круглой скобкой в косвенном вызове 
подпрограммы можно опускать. Предыдущий пример можно сократить до: 


$015раїтсһ{$1пдех} (1, 2, 3); 
фаггау[3]{“Епо1іѕћ”}[0] = “Јапиагу”; 


Для обычных массивов это дает многомерные массивы, такие же, как в С: 


$апзиег[$х][$у][$2] += 42; 
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Ну, хорошо, не совсем такие, как в С. Во-первых, С не умеет увеличивать масси- 
вы при необходимости, а Рег] умеет. Кроме того, некоторые конструкции, кажу- 
щиеся похожими, интерпретируются в этих языках по-разному. В Рей следую- 
щие две инструкции делают одно и то же: 


$1151геЕ->[2][2] 
$$1іѕігеғ[2][2] 


И 


7пе110; # Вполне понятно 
“пе110”, # Немного смущает 


Вторая инструкция может привести в замешательство программиста на С, привык- 
шего использовать *а[1], подразумевая: «на что указывает і-й элемент а». Но в Ре] 
пять символов ($ © * % &) имеют приоритет более высокий, чем фигурные или квад- 
ратные скобки! Поэтому за ссылку на массив принимается $$1іѕїгеѓ, ане $1іѕігеї[2]. 
Чтобы было как в С, нужно либо написать ${$115їгеѓ[2]) и заставить Рег| интер- 
претировать $1іѕіге?[2] перед разыменованием $, либо использовать стрелку ->: 


$1іѕтге?[2]->[%одгеет1по] = "пе110'; 


Использование методов объектов 


Если ссылка указывает на объект, то класс, определяющий этот объект, может 
предоставлять методы доступа к содержимому объекта, которых следует придер- 
живаться, если вы лишь используете класс (а не являетесь его автором). Иными 
словами, ведите себя хорошо и не обращайтесь с объектом, как с обычной ссыл- 
кой, даже при том, что Регі позволяет это делать в случае острой необходимости. 
Реп не обеспечивает принудительную инкапсуляцию. Мы не сторонники тотали- 
таризма. Однако мы рассчитываем на элементарную вежливость. 


В обмен на вежливость вы получаете полную ортогональность между объектами 
и структурами данных. Любая структура данных может вести себя как объект, 
когда это требуется. Или не вести, когда не требуется. 


Псевдохеши 


Псевдохеши когда-то служили средством интерпретации массивов в виде хешей 
с целью имитации упорядоченных хешей. Псевдохеши оказались не самым удач- 
ным экспериментом и не существуют начиная с версии у5.10, но многие продол- 
жают использовать более старые версии Регі, поэтому мы решили коротко упомя- 
нуть о них, хоть вам и не следует их применять. Для работы с псевдохешами при- 
менялись функции рћаѕћ и лем из модуля #1е19$5. 


Интерфейс доступа к псевдохешам, Ғіе145::рһаѕћ, не поддерживается с версии 
у5.10, однако функция ѓіе105::пем все еще доступна. Тем не менее, вместо нее сле- 
дует использовать ограниченные хеши из стандартного модуля Наз!:: 0111. 


Другие приемы работы с жесткими ссылками 


Как говорилось выше, оператор обратной косой черты обычно используется с одним 
объектом ссылки для создания одной ссылки, но возможны и другие сценарии. 


Это не связано с приоритетами операторов. Разыменовывающие символы в Рег! не яв- 
ляются операторами в этом смысле. Просто грамматика Рег] просто запрещает предва- 
рять начальным разыменовывающим символом что-либо более сложное, чем обычная 
переменная или блок. 
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Если применить этот оператор к списку объектов ссылок, он генерирует список 
соответствующих ссылок. Вторая строка в следующем примере делает то же, что 
и первая, поскольку обратная косая черта автоматически распределяется по все- 
му списку. 


@ге! 1151 = (\%5, \@а, \Уп, \8Р); # Список из четырех ссылок 
@ге?115ї1 = \($$, @а Жһ, &Г); Е То же самое 


Если список в круглых скобках содержит ровно один массив или хеш, то интерпо- 
лируются все значения массива или хеша и возвращаются ссылки на каждое из 
них: 


@гет 1151 
Өгеғ1іѕї 


\(@х); # Интерполировать массив, затем получить ссылки 
тар { \$_ } @х; # То же самое 


То же происходит при наличии внутренних скобок: 


@геғ1151 = \(@х, (@у)); # Разворачиваются только одиночные составные объекты 
бгеѓ1151 = (\@х. тар { \$_ } @у): # То же самое 


Если то же проделать с хешем, результат будет содержать ссылки на значения (ожи- 
даемый результат) и ссылки на копии ключей (довольно неожиданный результат). 


Поскольку срезы массивов и хешей представляют собой простые списки, перед 
любым из них можно поставить обратную косую черту и получить список ссы- 
лок. В каждой из трех последующих строк делается одно и то же: 


фепугеѓѕ = \@ЕМУ{“НОМЕ`, “ТЕВМ”}; # Обратная косая черта перед срезом 
@епуге!з = \( ФЕМУ{ХНОМЕ}, ФЕМТЕВМ} ); # Обратная косая черта перер списком 
@епуиге! $ = ( \ФЕМУ{НОМЕ}, \ФЕМ{ТЕВМ} ); # Список из двух ссылок 


Поскольку функции могут возвращать списки, к ним так же можно применять 
обратную косую черту. Если нужно вызвать несколько функций, сначала интер- 
полируйте значения, возвращаемые функциями, в один большой список, а затем 
поставьте перед ним обратную косую черту: 


@ге! 1151 = \Ғх(); 

@геғ11$ї = тар { \$_ } #х(); # То же самое 
@ге! 113+ = \( #х(), Ру(), 12() ), 

@ге! 1131 = ( \#х(), \РУО, \#2() ) # То же самое 
@ге! 1151 = тар { \$_ } ?х(), РУО, #2(); # То же самое 


Оператор обратной косой черты всегда предоставляет своему операнду списочный 
контекст, поэтому все эти функции вызываются в списочном контексте. Если же 
сам оператор обратной косой черты находится в скалярном контексте, в итоге бу- 
дет получена ссылка на последнее значение списка, который вернула функция: 


бгеҒ1151 = \1оса141те(); # Ссылки на каждый из 9 элементов времени 
ФЛазтгег = \1оса1+іте(); # Ссылка на признак летнего времени 


В этом отношении обратная косая черта действует подобно именованным списоч- 
ным операторам, таким как ргіпї, геуегзе и ѕ0гї, всегда предоставляющим спи- 
сочный контекст в правой части независимо от того, что происходит в левой. Как 
и с именованными списочными операторами, явно используйте ѕса]аг, чтобы ус- 
тановить скалярный контекст для последующих операндов: 


фаатеге! = \эса1аг 1оса1т1те(); # \"Тие Ост 18 07:23:50 2011” 
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Определить, на что указывает ссылка, можно с помощью оператора геї. Считайте 
ге? оператором «їуреоѓ», который возвращает истиное значение, если его аргумент 
является ссылкой, и ложное в противном случае. Возвращаемое значение зависит 
от типа объекта ссылки. Встроенными типами являются САГАА, АВВАҮ, НАЅН, СОЕ, 
010В, ВЕР, УЗТАТЮС, ТО, [УАШЕ, РОВМАТ и ВЕСЕХР плюс классы уегз1оп, Ведехр и 10::Напо]е. 
Проверить аргументы подпрограммы при помощи оператора ге! можно так: 


Зи зим { 
пу $аггауге? = ѕһћіїт; 
магп "Не ссылка на массив” 1+ геї($аггаугеѓ) пе "АВВАҮ"; 
гефигп ема1 јоіп("+", ёфаггаугеғ); 


} 


зау зит([1.. 1001); # 5050, формула Эйлера 


Жесткая ссылка в строковом контексте превращается в строку, содержащую тип 
и адрес: ЗСАГАН(Ох1Рс0е). (Обратное преобразование невозможно, поскольку при 
преобразовании в строку теряются данные о счетчике ссылок, а также потому, 
что было бы опасно позволить программе обращаться к адресу памяти, указанно- 
му в произвольной строке.) 


Посредством оператора 01е$$ можно устанавливать связь между объектом ссылки 
и пакетом, действующим как класс объекта. В таком случае ге? возвращает не 
внутренний тип, а имя класса. При использовании ссылки на объект в строковом 
контексте возвращается строка, содержащая внешний и внутренний тип, а так- 
же адрес памяти: МуГуре=НАЗН(0х20910) или 10::Напд1е=10(0х186904). Объектам и под- 
робностям работы с ними посвящена глава 12. 


Поскольку способ разыменовывания всегда определяет вид возвращаемого объ- 
екта ссылки, фуреё1оБ, хотя и содержит несколько объектов ссылки различных 
типов, может использоваться так же, как ссылка. Тоесть, выражения ${паіп::Ғоо} 
и ${\$та1т: : 00} обращаются к одной и той же скалярной переменной, хотя послед- 
нее обращение более эффективно. 


Такой прием позволяет вставить в строку значение, возвращаемое подпрограммой: 
ѕау "На этот раз моя подпрограмма вернулё @{[ туѕио(1, 2,3) 1}. 


Как это работает? Когда компилятор обнаруживает 6{...} в двойных кавычках, то 
интерпретирует это выражение как блок, возвращающий ссылку. Квадратные 
скобки в блоке создают ссылку на анонимный массив, содержащий все, что нахо- 
дится в них. Поэтому на этапе выполнения пуѕиб(1,2,3) вызывается в списочном 
контексте, а результаты помещаются в анонимный массив, ссылка на который 
возвращается внутри блока. Эта ссылка на массив немедленно разыменовывает- 
ся охватывающим 6(...}, а содержимое массива вставляется в строку в двойных 
кавычках уже в обычном порядке. Такое крючкотворство удобно использовать 
и с произвольными выражениями, например: 


зау “Нам нужно @{ [$п + 5] } штуковин!” 


Но будьте осторожны: квадратные скобки создают списочный контекст для сво- 
его выражения. В данном случае это безразлично, но в предыдущем вызове пуѕир 
могло иметь значение. Когда это существенно, устанавливайте контекст явно с по- 
мощью ѕса1аг: 


зау "теперь тузиь возвращает @{ [5саЈаг туѕио( 1,2, 3)]1 }."; 
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Замыкания 


Выше мы говорили о создании анонимных подпрограмм с помощью конструкции 
зи {}, не содержащей имени. Можно считать, что такие подпрограммы определя- 
ются на этапе выполнения, а это означает, что они обладают такими характери- 
стиками, как момент генерации и местонахождение определения. Во время соз- 
дания подпрограммы в области видимости могут находиться одни переменные, 
а при ее вызове — другие. 


Забудем на мгновение о полпрограммах и рассмотрим ссылку на лексическую пе- 
ременную: 


{ 
пу $с1 ег = "сате1“; 
ФогіїтеггеЁ = \Фсгіїїтег; 


} 


Значением $$сгіїегге? останется “сате1", несмотря на то, что $сгіїїег исчезает за 
закрывающей фигурной скобкой. Но $сг{{ег"е{ с таким же успехом может ссы: 
латься на подпрограмму, выполняющую обращение к $сг1 Тег: 


{ 


Ш 


пу фсгії+ег = "сате1"; 
$огіїтеггеЁ = ѕир { гефиги $сгіїїег }; 


} 


Это и есть замыкание (сіозиге), понятие, пришедшее из функционального про- 
граммирования на языках ШР и Ѕсһепе.! Оно означает, что анонимная функ- 
ция, определенная ь некоторой лексической области видимости в тот или иной 
момент времени, при вызове извне этой области должна вести себя так, будто на 
ходится в этой области видимости. (Пурист сказал бы, что она ничего не долж 
на — она действительно выполняется в этой области видимости.) 


Иными словами, каждый раз гарантируется получение того же экземпляра лек- 
сической переменной, даже если другие экземпляры этой лексической перемен- 
ной были созданы раньше или позже для других экземпляров этого замыкания. 
Это дает возможность устанавливать значения, используемые в подпрограмме, 
в момент ее определения, а не только при вызове. 


Замыкание можно также рассматривать как способ определения шаблона подпро- 
граммы без использования е\а1. Лексические переменные выступают в качестве 
параметров заполнения шаблона, что удобно для конструирования небольших 
фрагментов кода с отложенным выполнением. В событийно-ориентированном 
программировании, когда фрагменты кода связываются с событиями нажатий 
клавиш, щелчков мышью, появлением окон и прочими, они обычно называются 
функциями обратного вызова (саЙБасЁз). В качестве функций обратного вызова 
замыкания обладают ожидаемым поведением, даже если у вас нет ни малейшего 
понятия о функциональном программировании. (Обратите внимание: все, что го- 
ворилось о замыканиях, относится только к лексическим переменным пу и ѕїаїе. 
Глобальные переменные продолжают работать как обычно, потому что они не соз- 
даются и не уничтожаются, как это происходит с лексическими переменными.) 


1 Вданном контексте слово «функциональное» не должно рассматриваться как антоним 
слова «дисфункциональное». 
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Другое применение замыкания находят в генераторах функций, т.е. в функци- 
ях, которые создают и возвращают совершенно новые функции. Вот пример гене- 
ратора функций, реализованного с помощью замыканий: 


зир маке_зау1па { 
пу $ѕа1ите = ѕһіҒї; 
ту фпемРипс = ѕиб { 
пу Фтағдеї = ѕһіғї, 
ѕау “$ѕа1ите, $#агдеї! “; 
}; 


гефигп Фпемёипс; # Возвращает замыкание 
} 
$? = паке_зау1п9(“Номау” ); # Создает замыкание 
$9 = паке ѕауіпо("бгееїіпдз”); # Создает еще одно замыкание 


н Спустя некоторое время 


ФҒ->("мог1а”); 
$0->("еагіһ11п95“); 


В результате будет выведено: 


Ному, мог1а! 
бгеетіпоѕ, еагїһ11п95! 


Обратите внимание, что $5а1иїе продолжает ссылаться на фактическое значение, 
переданное в паке_ѕауіпо, хотя пу $$а10їе вышла из области видимости ко времени 
вызова подпрограммы. Для этого и предназначены замыкания. Поскольку $ и $9 
содержат ссылки на функции, которым при вызове требуется доступ к разным 
версиям $ѕа1иїе, эти версии автоматически сохраняются. Если теперь перезапи- 
сать $Г, то ее версия $ѕа1џїе автоматически исчезнет. (Регі производит уборку, 
только когда вы этого не видите.) 


Ре! не поддерживает ссылки на методы объектов (описываемые в главе 12), но 
похожего эффекта можно добиться с помощью замыкания. Допустим, что нужна 
ссылка не просто на подпрограмму, представленную методом, но на подпрограм- 
му, вызывающую метод определенного объекта. Объект и метод можно сохранить 
в лексических переменных, связанных с замыканием: 


ѕир деф метпод_геЁ { 
ту ($5е1#, Фтетпоопате) = @_; 
ту $тетһге? = зи6 { 
# @ внизу не та же, что вверху! 
гетигп $5е1 #->$теїһодпате(@_); 
}; 
гефигп Фтеїћге?; 


} 


пу $009 = пем 0оддіе: : # новая собачонка 
Мате => "иску", # по кличке Везунчик. 
Іедѕ => 3, Ё у нее три ноги 


Таі1 => “с1іррей"; # и куцый хвост 


сиг $маддег = деї теїһос_геғ(%000, ‘мад’); 
$наддег->("+аі1”); Е Вызовет $809->мад("1а11") 
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Теперь можно заставить Везунчика (ГасКу) вилять (маг) тем, что осталось от его 
хвоста, даже когда лексическая переменная $009 уйдет из области видимости, 
а Везунчика не будет видно: глобальная переменная $маддег заставит его вилять 
хвостом, где бы он ни находился. 


Замыкания как шаблоны функций 


Использование замыкания в качестве шаблона функции позволяет сгенериро 
вать несколько функций, действующих аналогичным образом. Допустим, нам 
нужен набор функций, генерирующих изменение цвета шрифть в НТМІ: 


рг1пі “Будь , гед(“осторожен”), “” с этим , дгееп(“огнем”). !! 


Функции гей и дгееп должны быть очень похожи. Хотелось бы дать им имена, но 
у замыканий нет имен, так как они — простые анонимные подпрограммы. Чтобы 
обойти это обстоятельство, прибегнем к хитрому трюку. Ссылку на код можно 
связать с существующим именем, присвоив его переменной фуре81оЪ с нужным 
именем функции. См. раздел «Таблицы имен» главы 10. В данном случае мы свя- 
жем ссылку с двумя разными именами, где одно составлено из символов верхнего 
регистра, а другое из символов нижнего регистра: 


@с010г$ = ди(гед Б1ие дгееп уе12ом огапде ригр1е м1о1ет); 
Гог пу Фпате (@со1огѕ) { 
по вігісі "геЁз”", # Разрешить символические ссылки 
*фпате = *{ис Фпате} = зиб { "<РОМТ СОГОВ=  $пате`> @ </РОМТ>” }; 
} 


Теперь функции можно вызывать с именами гей, ВЕР, Б1ие, ВШЕит.д.; при этом бу- 
дут вызываться соответствующие замыкания. Этот прием уменьшает продолжи- 
тельность компиляции и экономит память, а также уменьшает вероятность оши- 
бок, поскольку проверка синтаксиса происходит во время компиляции. Важно, 
чтобы при создании замыкания все переменные в анонимной подпрограмме бы- 
ли лексическими. Это объясняет появление пу в примере выше. 


Это один из тех редких случаев, когда имеет смысл указать прототип для замы- 
кания. Если потребуется установить скалярный контекст для аргументов этих 
функций (что может быть не лучшим решением в данном примере), можно напи- 
сать так: 


*Фпате = ѕиб ($) { “<РОМТ СОГОН=`$пате` >$_[0]</РОМТ>` }; 


Почти хорошо. И все же, поскольку проверка прототипа выполняется на этапе 
компиляции, от присваивания на этапе выполнения мало пользы — оно происхо- 
дит слишком поздно. Положение можно исправить, поместив весь цикл в блок 
ВЕСТМ, чтобы присваивание происходило на этапе компиляции. (Более вероятно, 
что цикл придется поместить в модуль, загружаемый с помощью и5е на этапе 
компиляции.) В этом случае прототипы будут видимы на всем протяжении ком- 
пиляции. 


Вложенные подпрограммы 


Если вы привыкли (в других языках) использовать подпрограммы, вложенные 
в другие подпрограммы и имеющие свои локальные переменные, вам придется 
приложить дополнительные усилия, чтобы использовать такой прием в Рег]. 
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Именованные подпрограммы, в отличие от анонимных, не умеют играть в мат- 
решки. Но вложенные подпрограммы с лексической видимостью можно эмули- 
ровать посредством замыканий. Например: 


ѕир оџѓег { 
пу $х = $ [0] + 35; 
10са1 *іппег = $00 { гефигп $х * 19 } 
гефигп $х + іппег(); 


} 


Теперь 1ппег может вызываться только из оитег, поскольку в замыкании выпол- 
няются временные присваивания. Но в момент вызова 1ппег получает обычный 
доступ к лексической переменной $х из области видимости оџїег. 


При этом возникает интересный эффект создания функции, локальной для дру- 
гой функции, что в Рег], вообще говоря, не поддерживается. Поскольку 10са] име- 
ет динамическую область видимости, а имена функций являются глобальными 
в своих пакетах, любая другая функция, которую вызовет оџїег, также сможет 
вызвать временную версию 1ппег. Чтобы помешать этому, нужно ввести еще один 
уровень косвенной адресации: 


ѕир оитег { 
пу $х = $ [0] + 35; 
ту $іппег = зиб { гефигп $х * 19 }; 
гефигп $х + $іппег->(); 
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Что произойдет, если попытаться разыменовать значение, не являющееся жест- 
кой ссылкой? Это значение будет рассматриваться как символическая ссылка 
(зутфойс гејегепсе). То есть ссылка будет интерпретироваться как строка с име- 
нем глобальной переменной. 


Например: 
Фпате = "рат"; 
$Фпаше = 1; # Установит Фрат 
фпате->[0] = 4; # Установит первый элемент @бат 
фпате->{Х} = "У"; # Установит элемент Х хеша %бат равным Ү 
@Фпате = (); # Очистит @бат 
Кеуз #$папе; # Вернет ключи %Бат 
&Фпате; + Вызовет &рат 


Это очень мощное средство и немного опасное, потому что можно намереваться 
(совершенно искренне) использовать жесткую ссылку, но случайно применить 
символическую. Чтобы защититься от этого, можно сделать так: 


иѕе 51гіст "геЁѕ"; 


Точнее, этого не умеют глобальные именованные подпрограммы. К сожалению, друго- 
го типа объявлений именованных подпрограмм у нас нет. Мы пока не реализовали име- 
нованные подпрограммы с лексической областью видимости (известные как пу хиб). но 
когда мы это сделаем, они будут поддерживать вложенность. 
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Теперь до конца охватывающего блока будут разрешены только жесткие ссылки. 
Вложенный блок сможет отменить это решение с помощью 


по ѕігісї "геғѕ”; 
Важно также понимать различия между следующими двумя строками кода: 


ф{ідепсіғіег}, # То же, что $ідепіі?іег. 
${"1депіі?іег”}; # Тоже $ійепіі Ғіег, но символическая ссылка. 


Поскольку во второй форме использованы двойные кавычки, она будет считаться 
символической ссылкой и вызовет сообщение об ошибке в области действия џѕе 
ѕїігісі “геЁг$”. Даже если ѕїгісї “геЁз” не действует, такая форма может ссылаться 
только на переменную пакета. Первая форма идентична форме без скобок и смо- 
жет ссылаться даже на переменную с лексической областью видимости, если та- 
ковая объявлена. Эта возможность демонстрируется в следующем примере (и об- 
суждается в следующем разделе). 


Через символические ссылки доступны только переменные пакета, потому что 
поиск символических ссылок всегда выполняется в таблице имен пакета. По- 
скольку лексические переменные не включаются в таблицу имен пакета, они не- 
видимы для данного механизма. Например: 


сиг $уаше = "91ора1"; 
{ 
пу Фуа1ие = "ргімаїе"; 
ргіпі “Іпѕіде, тіпе 1$ ${\а1ие}, 
ѕау “биі оигѕ 1$ ${`ма10џе" }."; 
} 
ѕау "Оџиїѕіде, ${уа1ие} 1$ адазп ${“ма1ие"}. `- 


в результате будет выведено: 


Іпѕіде, тіпе 1$ рг1уафе, биі оиг$ 1$ д1оба1. 
Ои{$14е, д1ораі 15 адаіп 9106а1. 

[Внутри ~ мое приватное, а наше – глобальное. 
Снаружи глобальное так и останется глобальным. ] 


Фигурные скобки, квадратные скобки и кавычки 


В предыдущем разделе отмечалось, что ${ійепііѓіег) не считается символической 
ссылкой. Вас может заинтересовать, как в этом участвуют зарезервированные 
слова, и кратким ответом будет: «Никак». Хотя риѕћ является зарезервирован- 
ным словом, следующие две инструкции выведут "рор оп оуег": 


фриѕћ = "рор оп”; 
ргіпі “${ризп}омег” 


Причина в том, что исторически таким способом в оболочках ОМЕХ имена пере- 
менных отделяются от последующего буквенно-цифрового текста, который, в про- 
тивном случае, интерпретировался бы как часть имени. Именно такого поведения 
многие ожидают от интерполяции переменных, поэтому Рей работает так же. Но 
в Рег] эта идея получила дальнейшее развитие и применяется к любым фигур- 
ным скобкам, используемым при создании ссылок, независимо от того, заключе- 
ны ли они в кавычки. Это значит, что: 
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рипЕ ${ризп} — ‘оуег“ 
или даже (поскольку пробелы никогда не учитываются): 
ргіпё ${ ризн }  ‘омег”, 
выведет "рор оп оуег’, несмотря на то, что фигурные скобки находятся вне двой- 


ных кавычек. То же правило действует для любого идентификатора, используе- 
мого в качестве индекса хеша. Поэтому вместо: 


фпази{ “ааа” }{ Ы” }{ “сес” } 
можно написать просто: 

$һаѕп{ ааа }{ ооо }{ ссс } 
или: 

$пазп {ааа} {000} {ссс} 


и не беспокоиться, что индексы могут оказаться зарезервированными словами. 
Поэтому выражение: 


фһаѕһ{ ѕһіғг } 


интерпретируется как $ћаѕћ{”ѕһіғї”}. Добиться интерпретации индекса в качест- 
ве зарезервированного слова можно, добавив что-то, что выведет текст в скобках 
за рамки синтаксиса идентификатора: 


Фһаѕһ{ 5һіғЕ() } 
фһаѕһ{ +5һіғЕ } 
фиазН{ зна @ } 


Ссылки не могут быть ключами хеша 


Ключи хешей внутренне хранятся как строки.! Если попытаться использовать 
ссылку в качестве ключа хеша, значение ключа будет преобразовано в строку: 


$х{ \$а } = $а; 
($кеу, $уа1ие) = еаси %х, 
ргіпе $$кеу; # НЕВЕРНО 


Выше говорилось, что нельзя преобразовать строку обратно в жесткую ссылку. 
Поэтому, если попытаться разыменовать $кеу, содержащую простую строку, про- 
изойдет разыменование не жесткой ссылки, а символической - а так как весьма 
вероятно, что переменной с именем 5САГАВ(0х1Рс0е) нет, попытка не даст желаемо- 
го результата. Скорее, вам требуется что-то вроде этого: 


$г = \@а; 
$х{ $г } = $ 


Тогда, по крайней мере, можно будет использовать значение хеша, которое будет 
жесткой ссылкой, а не ключ, который ею не будет. 


Хоть и нельзя использовать ссылку как ключ, если жесткая ссылка использует- 
ся в строковом контексте (как было в примере выше), она гарантированно соз- 


1 Они и внешне хранятся как строки, например, их помещают в файл ОВМ. На самом 
деле, файлы ОВМ требуют, чтобы их ключи (и значения) были строками. 
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даст уникальную строку, поскольку в нее будет включен адрес ссылки. Поэтому 
на практике ссылку можно использовать в качестве уникального ключа хеша, 
Просто потом нельзя будет разыменовать ее. 


Существует один особый вид хеша, в котором можно использовать ссылки в каче- 
стве ключей. Благодаря волшебству (та) модуля 1іе::ВеғНаѕћ, поставляемого 
в составе Регі, невозможное становится возможным: 


изе Тіе: : ВегНазп; 

їіе ту %һ, “Те: : ВеғНаѕћ”; 

чи = ( 
["піѕ", "һеге"] => "аї поте”, 
[еһаї", "реге" ] => "е15емһеге”, 

); 

мһі1е ( ту($Кеуге?, $уа1ие) = еасһ %н ) { 
ѕау “@фКкеугеЁ 1$ $уа1ие"; 

} 


На самом деле, связывая (Че) различные реализации со встроенными типами, 
можно добиться от скаляров, хешей и массивов многого из того, чего, как мы ут- 
верждаем, они делать не могут. Это послужит нам уроком! Мы такие бестолковые... 


Подробнее о связывании — в главе 14. 


Сборка мусора, циклические ссылки и слабые ссылки 


Языки высокого уровня обычно позволяют программистам не заботиться об осво- 
бождении памяти, которая больше не используется. Этот автоматический про- 
цесс переработки отходов известен как сборка мусора (ЕагБаяе соПесііоп). В боль- 
шинстве случаев Рег! использует быстрый и простой механизм сборки мусора, 
основанный на ссылках. 


При выходе из блока его переменные с локальной областью видимости обычно ос- 
вобождаются, однако можно так спрятать свой мусор, что сборщик мусора его не 
найдет. Одна из серьезных опасностей заключается в том, что недоступная па- 
мять с ненулевым счетчиком ссылок обычно не может быть освобождена. Поэто- 
му применение циклических ссылок — плохая идея: 


{ # заставим $а и $6 указывать друг на друта 
ту ($а, $6); 
$а = \$0; 
$6 = \$а; 


} 
или еще проще: 
{ # заставим Фа указывагь на саму себя 
пу $а; 


$а = \$а; 
} 


Переменную $а следует освободить в конце блока, однако этому не бывать. В ре- 
курсивных структурах данных необходимо самостоятельно разрывать (или ослаб- 


1 Да, это действительно технический термин, как можно заметить, если просмотреть 


файл т.с в дистрибутиве исходного кода Рег]. 
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лять, см. ниже) автоссылки, чтобы память была утилизирована прежде, чем про- 
грамма (или поток) завершит работу. (При выходе память будет освобождена 
автоматически путем дорогостоящей, но полной процедуры сборки мусора.) Ес- 
ли структура данных является объектом, для автоматического разрыва ссылки 
можно применить метод 0Е5ТВ0Ү; см. раздел «Сборка мусора с помощью методов 
РЕЗТВОУ» в главе 12. 


Аналогичная ситуация может иметь место с кэшами - хранилищами данных, 
предназначенными для ускорения доступа к этим данным. Вне кэша могут суще- 
ствовать ссылки на данные, находящиеся в нем. Проблема возникает, когда все 
эти ссылки уничтожаются, а данные в кэше со своими внутренними ссылками 
продолжают существовать. Существование хотя бы одной ссылки не позволяет 
утилизировать объект ссылки, даже если мы хотим, чтобы данные исчезали из 
кэша, как только они становятся не нужны. Как и в случае циклических ссылок, 
нам нужна ссылка, которая не влияет на счетчик ссылок и не задерживает сбор- 
ку мусора. 


Ниже демонстрируется еще один пример, на этот раз – двусвязного циклического 
списка: 


фгіпо = { 
УАЦЈЕ => ипдет, 
МЕХТ => ипдет, 
РВЕМ => ипдет, 
} 
$г1п9->{МЕХГ} 
$и1п9-> {РАЕМ} 


$г1п9; 
$гіпо; 


Ш 


Счетчик ссылок на лежащий в основе хеш равен трем, а операция присваивания 
значения ипдег переменной $гіпо или выход ее за пределы области видимости 
уменышит счетчик только на единицу: в результате память, занимаемая хешем, 
не может быть автоматически освобождена сборщиком мусора Рег]. 


Для исправления этой ситуации в Рей было введено понятие слабых ссылок (шеаЁ 
ге]егепсез). Слабая ссылка действует подобно любым другим ссылкам (имеются 
в ВИДУ «жесткие», а не «символические» ссылки), за исключением двух важных 
особенностей: она не участвует в вычислении значения счетчика ссылок на объект 
ссылки, а когда объект ссылки утилизируется сборщиком мусора, ссылка автома- 
тически получает значение ипіеѓ Благодаря этим особенностям слабые ссылки от- 
лично подходят для реализации структур данных, хранящих внутренние ссылки. 
Внутренние ссылки не будут учитываться счетчиком ссылок, а внешние будут. 


Хотя Рей поддерживал слабые ссылки начиная с версии У5.6, стандартная функ- 
ция иеакеп для доступа к ним из программ на Рег! появилась только в Рег! версии 
у5.8.1, в составе стандартного модуля Зса1аг::/411. В этом модуле имеется так- 
же функция 1$_меак, позволяющая определить, является ли указанная ссылка 
слабой. 


Ниже показано, как можно было бы переписать реализацию циклического списка; 
и5е Зса1аг::0411 ом(меакеп); 
фгіпд = { 


МАШЕ => ипаеЁ 
МЕХТ => ипдег, 
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РВЕУ => ипаеТ, 
}; 
$г1п09->{МЕХТ} = Фгіпо; 
$г1па->{РНЕУ} = $г1пд; 
меакеп($гіпо->{М№ЕХТ}); 
меакеп($гіпо->{РВЕМ} ) 


С точки зрения оператора гет, слабые ссылки действуют подобно обычным (жест- 
ким) ссылкам: они позволяют определить тип объекта ссылки. Но когда объект 
слабой ссылки утилизируется сборщиком мусора, переменная, хранящая слабую 
ссылку, автоматически получает неопредєленное значение, так как не может 
ссылаться на несуществующий объект. 


Операция копирования слабой ссылки создает обычную ссылку. Если в результа- 
те копирования необходимо получить еще одну слабую ссылку, полученную ко- 
пию следует передать функции меакег. 


Более объемный пример управления слабыми ссылками приводится в книге «Ре 
СооКЪоокК», в рецепте 11.15 «Соршя мі Сігсиаг Оафа Эёгисвагез изшё Меак Кеѓе- 
гепсез» (копирование циклических структур данных, использующих слабые ссыл- 
ки) (№Нр://ту.зайапБооЕзопйпе.сот/боо/рговтаттт8/рет/0596003137/теегепсез- 
апд-гесогаз/рейсЕЬЕ2-сйр-11-зес1-15). 


Структуры данных 


Рей предлагает множество готовых структур данных, которые в других языках 
приходится создавать самостоятельно. Стеки и очереди, изучаемые будущими 
специалистами по информатике, в Ре] являются простыми массивами. Если 
к массиву применяются функции риѕћ и рор (или 5ћіѓї и ип5ћ1Ғї), он ведет себя как 
стек; а если риѕћ и ѕћіѓї (или ипз 1 и рор), он ведет себя как очередь. А многие 
древовидные структуры создаются только для ускорения доступа к концептуаль- 
но плоским таблицам поиска. В Регї, разумеется, есть встроенные хеши для быст- 
рого доступа к концептуально плоским таблицам поиска без использования 
структур данных, от рекурсивности которых цепенеет мозг, и кажущихся краси- 
выми лишь тем, чей мозг уже достаточно оцененел. 


Но иногда вложенные структуры данных действительно нужны, поскольку по- 
зволяют более естественно моделировать решаемую задачу. Поэтому Рег] позволя- 
ет комбинировать и вкладывать массивы и хеши для создания структур данных 
произвольной сложности. При правильном использовании они могут применять 
ся для создания связанных списков, двоичных деревьев, куч, В-деревьев, мно- 
жеств, графов и всего, что вы еще придумаете. См. книги «Маѕіегіпо А]согіїһтѕ 
мі Регі», О’ВеЩу, 1999 (Язык Рег! и реализация алгоритмов); «Рей СоокђооК», 
О’ЋеШу, 19981; раздел «Оава Ѕігисіџге СооКБооК» в страницах рей4зс справочного 
руководства или СРАМ — главное хранилище таких модулей. Но возможно, что 
вам никогда не понадобится ничего, кроме простых сочетаний массивов и хешей, 
поэтому о них-то мы и поговорим в этой главе. 


Массивы массивов 


Существует много видов вложенных структур данных. Проще всего построить 
массив массивов, называемый также двумерным массивом или матрицей. (До- 
пустимо очевидное обобщение: массив массивов массивов является трехмерным 


1 Т. Кристиансен, Н. Торкингтон «Реп: библиотека программиста». — Пер. с англ. — СПб.: 
Питер, 2001. 
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массивом и так далее для большего числа измерений.) Сам принцип достаточно 
прост, и почти все, что применимо в данном случае, может применяться к более 
замысловатым структурам данных, которые мы будем изучать в следующих раз- 
делах. 


Создание и использование двумерного массива 
Вот как создается двумерный массив: 


# Присвоить массиву список ссылок на массивы. 
ФАОА = ( 

[ "егеда", “Багпеу” ], 

[ “деогае”, “јапе`, "е1гоу" ], 

Г "һотег” “тагде”, "багі" ], 


); 
ргіпї $АоА[2](1]; # выведет “тагде“ 


Весь список заключен в круглые, а не квадратные скобки, потому что присваива- 
ется списочное значение, а не ссылка. Чтобы получить ссылку на массив. следует 
использовать квадратные скобки: 


# Создать ссылку на массив ссылок на массивы. 

фге?_То_АОА = [ 
[ "Ғгеа", “багпеу”, "ребр1еѕ", “Батт бат”, “діпо“, ], 
[ “һотег”, “багі”, "тагде", “таддіе", ], 
Г “деогде“, “јапе“, “е1гоу", “јибу", 1, 

1; 


ргіпі $геѓ_+о_Аод->[21[3], # выведет јиду ` 


Помните, что между каждой парой смежных фигурных или квадратных скобок 
подразумевается присутствие ->. Поэтому эти две строки: 


$АоА[2][3] 
фгеғ Фо_АоА->[2][3] 


эквивалентны следующим двум строкам: 


ФАОА[2]->[3] 
фге?_То_АоА->[2]->[3] 


Но здесь не подразумевается присутствие -> перед первой парой квадратных ско- 
бок, поэтому для разыменования $геѓ їо_АоА необходима первая стрелка ->. Пом- 
ните также, что с помощью отрицательных индексов можно вести обратный от- 
счет от конца массива, поэтому: 


ФАОАГО|Г-2] 


вернет предпоследний элемент первой строки. 


Нара щивание массива 


Присваивание больших списков годится только для создания фиксированных 
структур данных, но как быть, если требуется конструировать структуру по час- 
тям или вычислять ее элементы «на лету»? 
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Прочтем структуру данных из файла. Предположим, что это простой текстовый 
файл, где каждая строка содержит структурированные данные и состоит из эле- 
ментов, разделяемых пробельными символами. Вот как нужно действовать: 


мһ11е (<>) { 
©їтр = 5р117; # Расщепить элементы в массив. 
рыѕћ @АоА, [ @Ётр ]; # Добавить в @АоА ссылку на анонимный массив. 


} 


Конечно, нет необходимости давать имя временному массиву, поэтому можно 
сказать и так: 


мһіІе (<>) { 
риѕћ @АоА. [ ѕр11ії 1: 
} 


Получить ссылку на массив массивов можно так: 


мһі1е (<>) { 
ризн @фгеѓ то_АоА, 1 5р111 ]; 
} 


В обоих примерах к массиву массивов добавляются новые строки. А как добавить 
новые колонки? При работе с двумерными массивами часто проще использовать 
обычное присваивание:? 


Рог $х (0 .9){ # Для каждой строки. . 
Рог $у (0 .. 9) { # Для каждой колонки... 
ФАоА[$х]($У] = Ғипс($х, $у); # ... присвоить этой ячейке 


Рог $х ( 0..9 ) { # Для каждой строки. 
$геГ_То_АоА->[$х][3] = Рипс2($х): # присвоить четвертой колонке 


} 


Порядок присваивания значений элементам не важен, как и наличие в @АоА эле- 
ментов с указанными индексами: Рег] охотно создаст их для вас, установив неоп- 
ределенное значение в промежуточных элементах (при необходимости Рег даже 
создаст первую ссылку в $геѓ Тто_Аод). Чтобы просто добавить элементы в конец 
строки, нужно проявить немного смекалки: 


# Добавить новые колонки к существующей строке 
ризй @{ $АоАГО] }, “мата”, “Бетту“; 


У кого-то, возможно, возникнет вопрос: можно ли избежать разыменования 
и просто записать: 
риѕћ ФАОА[0], "мі1та”, "беїту”; # ошибка компиляции < \5. 14! 


Мы тоже задались тем же вопросом. Долгое время этот код вообще не компилиро- 
вался, потому что аргумент функции риѕћ должен быть настоящим массивом, а не 


Здесь, как и в других главах, мы опускаем (для ясности) объявления пу. В данном при- 
мере надо было бы написать пу @їтр = =р11ї. 


Как и в присваивании временной переменной выше, мы упростили код: в рабочем коде 
для циклов, обсуждаемых в этой главе, эта форма выглядела бы как ог пу $х. 
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ссылкой на массив. Поэтому первый аргумент обязательно должен начинаться 
символом @. То, что следует за @, может быть предметом обсуждения. 


Начиная с версии у5.14 иногда можно опускать явное разыменование при вызове 
некоторых встроенных функций. В число этих функций входят: рор, ризй, ѕћіѓї, 
ипѕћіѓт и $р11се — для массивов, и Кеуз, уа[иез, еасп — для хешей. Они больше не тре- 
буют, чтобы первый аргумент начинался с символа @ или %. Если функции пере- 
дать допустимую ссылку на коллекцию соответствующего типа, она будет разы 
менована при необходимости; в отличие от явного разыменования, такое неявное 
разыменование никогда не приводит к автовивификации. Если передать недопус- 
тимую ссылку, во время выполнения возникнет исключение. Поскольку при ком- 
пиляции подобного кода, использующего новые возможности, старый компиля- 
тор обязательно подавится, вы должны предупредить пользователей об этом, по- 
местив прагму изе УЕАЗТОМ в начало файла: 


ие 5.014, # запретить розлив молодого вина в старые бутылки 
иѕе %5. 14; # запретить накладывать новые заплаты на старые платья 


Доступ к массивам и вывод 


А теперь выведем структуру данных. Если вас интересует лишь один элемент, 
достаточно следующего: 


ргіпі $АоА[3][2]; 
Но чтобы вывести весь массив, нельзя просто сказать: 
ргіпї @АОА; # НЕВЕРНО 


Это неверное решение, поскольку вместо значений вы увидите ссылки, преобра- 
зованные в строки. Рей не выполняет разыменование автоматически, поэтому 
придется написать один-два цикла. Следующий код выведет всю структуру, вы- 
полнив обход элементов @АоА в цикле с разыменованием каждого из них в отдель- 
ности в операторе ѕау: 


Рог $гом ( @АоА ) { 
ѕау "@фгом”; 
} 


Если требуется следить за индексами, можно сделать так: 


Ғог $1 ( 0 .. ФНАоА ) { 
зау "строка $1: @{$Аод[$1 ] }" 
} 


или даже так (обратите внимание на внутренний цикл): 


Тог $1 (0.. ФВАОА ) { 
Рог $ (0 $#{$АоА[$1 ]} ) { 
ѕау “элемент $1 $] — $АоА[$1 191°; 
} 
} 


Как видите, дело немного усложняется. Поэтому иногда проще решить задачу 
с помощью временной переменной: 


Тог $1 ( 0 .. $#АоА ) { 
фгом = $АоА[ $11]; 
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Рог $} (С.. $#{$гом} ) { 
ѕау “элемент $1 $]  $гом->[$)1"; 
} 


} 


Утомившись созданием пользовательских функций вывода для своих структур 
данных, обратите внимание на стандартные модули Обитруа1ие и Вата: :Бипрег. Пер- 
вый используется отладчиком Рец, а второй генерирует код, который может быть 
разобран анализатором Рей. Например: 


узе у5. 14; # используется прототип +, появился в №5. 14 


зиб ѕһом(+) { 
гедиіге Битруа1ие; 
зтате $ргеїті1у = пем битруа1ие: : 
+ісК => 0("), 
сотрастрџитр => 1, # закомментируите эти две строки 
уегуСотрасі => 1, # чтобы получить более подробный вывод 


ЧитрУа1ие $ргеїіті1у @ ; 
} 


# Присвоить массиву список ссылок на массивы. 
ту @АоА = ( 
[ “#геа”, “Багпеу” 1, 
Г "деогде”, "јапе", “е1гоу” ], 
1 "Һотег", "тагде", "Багі" Ј, 
); 
риѕћ $АоАГО], "мі1та", "беїту"; 
Ном ©АОА; 


выведет: 


0 0..3 “Ғгеу” "рагпеу" “ма1та” "беїту" 
1 0..2 "деогде" “јЈапе" “е1гоу” 
2 0..2 “һопег" “тагде“ “багі” 


Если закомментировать две строки, упомянутые в тексте программы, содержи- 
мое массива будет выведено в таком виде: 


0 АВВАУ(0х803190) 
0 "ғгеа” 
1 “багпеу” 
2 "мі1та" 
3 "реїћу" 
1 АВВАҮ(0х803040) 
0 “деогде” 
1 “јапе" 
2 “е1гоу” 
2 АВВАҮ(0х803е10) 
0 "Һотег” 
1 "тагде” 
2 “рагі” 


Нам симпатичен модуль баїа::рипр из архива СРАМ, который также можно ис- 
пользовать для вывода данных. Например, следующий код: 
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изе м5. 14; # для поддержки скаляров в функции риѕћ 
оѕе Бата: :Оитр ом(дитр); # модуль из СРАМ 
ту @АоА = ( 


[ “Ггеа”, орагпеу” ], 
[ “деогде“, “Запе”, “е1гоу“ 1, 
[ "Һотег", "тагде”, "багі" 1, 
); 
риѕћ ФАОА[01, “м11та”, "реїту”; 
дитр \@АОА; 


выведет: 


р 
[“Ргед”, “багпеу”, “мита”, "беїту”], 
[деогде“, “јапе“, “е1гоу“], 
["һотег” "тагде", "багт”], 


1 


Срезы 


Если нужно получить доступ к срезу (фрагменту строки) многомерного массива, 
придется использовать индексы несколько необычным способом. Стрелки указа- 
телей обеспечивают удобный доступ к отдельным элементам, но для срезов таких 
удобств не существует. Элементы среза можно извлечь последовательно с помо- 
щью цикла: 


ёрагі = (); 

Рог ($у = 7; $у < 13; $у++) { 
риѕћ ёрагї, ФАоА[4][$у]; 

} 


Данный конкретный цикл можно заменить срезом массива: 
брагі = @{ $Аод[4] } Г 7. 12 ] 


Если же требуется двумерный срез, например для $х в диапазоне 4..8 и $у в диапа- 
зоне 7. 12, его можно получить так: 


@пемАод = (); 
Ғог ($Тагіх = $х = 4; $х <= 8, $х++) { 
Рог ($5їагіу = $у = 7; $у <= 12; $у++) { 
фпемАоА[$х - Фәтагїіх]ј[$%у - $51агіу] = $АоА[$%х [$У1; 
} 
} 


В этом примере отдельным элементам двумерного массива @пемАоА последовательно 
присваиваются значения, извлеченные из двумерного подмассива @Аод. Как вари- 
ант можно создать анонимные массивы, каждый из которых содержит требуемый 
срез подмассива @АоА, и поместить ссылки на эти анонимные массивы в @пемАод. 
В этом случае мы будем записывать ссылки в @пемАоА (используя, если можно так 
выразиться, один индекс), а не значения из подмассива, используя два индекса. 
При таком подходе устраняется самый цикл самой глубокой вложенности: 


Рог ($х = 4, $х <= 8; $х++) { 
риѕћ @пемАоА, [ @{ $АоА[$х] } [7..12 ] ], 
} 
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Конечно, если вы делаете это часто, вероятно, следует написать подпрограмму, 
назвав ее, например, ехїгасі_гесїапд1е. А если редко и для больших наборов мно- 
гомерных данных, то следует, вероятно, воспользоваться модулем РО (Реп Раѓа 
Гапсиасе), который можно получить из СРАМ. 


Распространенные ошибки 


Как говорилось выше, массивы и хеши в Рег! являются одномерными. Даже 
«многомерные» массивы фактически имеют одно измерение, но значения в них 
являются ссылками на другие массивы, «схлопывающими» несколько элементов 
в один. При выводе этих значений без разыменования вы увидите не значения, 
а ссылки, преобразованные в строки. Например, следующие две строки: 


@АОА = ( [2, 3], [4. 5. 7]. [0] ); 
ргіпі “ЗАоА”* 


выведут что-нибудь вроде: 
АВВАҮ(0х83с38) АННАУ(0х86194) АВВАҮ(0х86100) 

С другой стороны, следующая строка выведет 7: 
ргіпЕ $АоА[1][21; 


Конструируя массивы массивов, не забывайте создавать новые ссылки для под- 
массивов, иначе получится массив, элементы которого будут представлять число 
элементов в подмассивах, например: 


Рог $1 (1..10) { 

@аггау = зотеРипс($1); 

$АОАГ$1] = @аггау; # НЕВЕРНО! 
} 


Здесь доступ к баггау осуществляется в скалярном контексте, поэтому возвраща- 
ется число его элементов, которое Ре послушно присваивает элементу $АоА! $1]. 
Как правильно присваивать ссылку, будет показано чуть ниже 


Допустив такую ошибку, человек понимает, что нужно присвоить ссылку, поэто- 
му следующая естественная ошибка — это многократное получение ссылки на 
один и тот же адрес: 


Тог $1 (1..10) { 

баггау = зотегипс($1); 

$АоА[$1] = \@аггау; # СНОВА НЕВЕРНО! 
} 


Все ссылки, созданные во второй строке цикла, будут одинаковыми, а именно — 
все они будут ссылками на один и тот же массив баггау. Да, этот массив изменяет- 
ся в каждом цикле, но когда все закончится, $АоА будет содержать 10 ссылок на 
один и тот же массив, содержащий последний набор присвоенных ему значений. 
Вызов ргіпі @{$А0А[1]} выведет те же значения, что и ргіпі @{$АоА[2]). 


Вот более удачное решение: 
Рог $1 (1..10) { 


баггау = зотеГипс( $1); 
$АоА[ $1] = Г @аггау ]; # ПРАВИЛЬНО! 


372 Глава 9. Структуры данных 


Квадратные скобки вокруг массива баггау создают новый анонимный массив, ку- 
да копируются значения элементов баггау. Затем мы сохраняем ссылку на этот 
новый массив. 


Следующий (более трудный для чтения) код даст аналогичный результат: 


Гог $1 (1. 10) { 
@аггау = ѕотеѓғипс($1); 
®{$АоАГ$1]} = @аггау; 
} 


Поскольку элемент $АоА[$1] должен быть новой ссылкой, она будет создана авто- 
матически. Затем предшествующий символ @ разыменует новую ссылку, в ре- 
зультате чего значения баггау будут присвоены (в списочном контексте) массиву, 
на который ссылается $А0А[$1]. Чтобы код был более понятным, такой конструк- 
ции стоит избегать. 


Но в одном случае ее все же можно использовать. Допустим, что @АоА уже являет- 
ся массивом ссылок на массивы, т.е. выполнены присваивания вида: 


$АоА[3] = \@огідіпа1 аггау; 


А теперь предположим, что нужно изменить @0г191па] _аггау (т.е. четвертую стро- 
ку $АоА) так, чтобы он ссылался на элементы баггау. Сделать это можно так: 


@{$Аод[3]} = @аггау, 


Вданном случае сама ссылка не меняется, изменяются элементы массива, на кото- 
рый она ссылается. В результате перезаписываются значения в массиве @огідіпа1 
аггау. 


Наконец, следующий код прекрасно работает, хотя и выглядит жутковато: 


Рог $1 (1..10) { 
пу @аггау = зотеГипс($1); 
$АоА[$1] = \@аггау; 

} 


Это объясняется тем, что переменная с лексической областью видимости пу баггау 
создается заново в каждой итерации цикла. И хотя кажется, будто каждый раз 
сохраняется ссылка на одну и ту же переменную, на самом деле это не так. Это 
тонкое отличие создает более эффективный код, хотя при этом возникает опас- 
ность ввести в заблуждение не слишком опытных программистов. (Он более эф- 
фективен, потому что в последнем присваивании не выполняется копирование.) 
С другой стороны, если значения все равно приходится копировать (в первом при- 
сваивании в цикле), можно использовать копирование, выполняемое квадратны- 
ми скобками, и избавиться от временной переменной: 


Рог $1 (1..10) { 
$АоА[ $3 ] = [ зотегипс($1) }; 
} 


Подведем итоги: 


$АоА[ $1 ] 
ФАОА[%1 ] 


[ ёаггау ]; # Самое безопасное, иногда самое быстрое 
\баггау; # Быстро, но рискованно, 

# зависит от наличия ту при массиве 
@{ $А0А[$1] } = @аггау; # Несколько мудрено 
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Овладев многомерными массивами, вы сможете заняться более сложными струк- 
турами данных. Вы не найдете в Ре! зарезервированных слов для создания струк- 
тур С или записей Разса]. Вместо них предоставляется более гибкая система. Если 
вы считаете, что структура записи должна быть менее гибкой или хотите дать сво- 
им пользователям нечто менее прозрачное и более жесткое, используйте возмож- 
ности объектно-ориентированного программирования, обсуждаемые в главе 12. 


В Рей всего два способа организации данных: упорядоченные списки, хранимые 
в массивах, с доступом по индексам, и неупорядоченные пары ключ/значение, хра- 
нимые в хешах, с доступом по именам. Для представления записей в Ре] лучше 
всего подходят ссылки на хеш, но выбор способа организации таких записей может 
быть различным. Кому-то понадобится хранить упорядоченный список этих запи- 
сей, и тогда следует использовать массив ссылок на хеши. Кому-то может потребо- 
ваться поиск записей по именам, и тогда следует создать хеш ссылок на хеши. 


В следующих разделах приводятся примеры, подробно показывающие, как соз- 
давать (с нуля), генерировать (на основе других источников данных), использо- 
вать и отображать структуры данных нескольких различных типов. Сначала мы 
покажем три простые комбинации массивов и хешей, затем хеп функций и более 
необычные структуры данных. И в заключение научим сохранять эти структуры 
данных. Приведенные примеры предполагают, что вы хорошо освоили материал, 
изложенный ранее в этой главе. 


Хеши массивов 


Используйте хеш массивов, когда нужно находить каждый массив по некоторой 
строке, вместо номера индекса. В нашем примере с персонажами телесериалов 
вместо того, чтобы просматривать списки имен 0-й серии, 1-й серии ит.д., мы сде- 
лаем так, что можно будет найти список действующих лиц по названию серии. 


Поскольку внешней структурой данных является хеш, мы не можем упорядочить 
содержимое, но можем использовать функцию 50гт для вывода данных в опреде- 
ленном порядке. 


Формирование хеша массивов 


Хеш анонимных массивов можно создать так: 


# Обычно мы опускаем кавычки, когда ключи являются идентификаторами 
НОА = ( 
Ғ1іптѕіопеѕ => [Г "гед", “Багпеу” 1, 
јеіѕопѕ => [ “деогде”, "јапе", "е1гоу" ], 
ѕітрѕопѕ => [ "һотег", “тагде”, "Багі" ], 
): 
Чтобы добавить в хеш еще один массив, можно просто сказать: 


ФНОА{те1еїирбіез} = [ "Тіпку міпку”, "дірѕу", “1аа-1аа`, “ро” ]; 


Генерирование хеша массивов 


Вот несколько приемов заполнения хешей массивов. Чтобы произвести чтение из 
файла следующего формата: 
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Ғ1іпіѕїопеѕ: Ёгед багпеу мі1та діпо 
јеіѕоп$: деогде јапе е1гоу 
5ітрѕоп: Һотег тагде Багі 


можно использовать любой из двух циклов: 


мне ( Ф ) { 
пех ип1ез$ $/^(.*?):\з*//; 
$Нод{$1} = [ 5р211 1; 

} 


мһіЛе ( $1іпе = <> ) { 
($ипо, Фгеѕї) = =р1ії /:\$*/, $1іпе, 2; 
Ә©ғҒіе105 = эр “ “, $геѕї; 
$НоА{$мһо} = [ @ғіе1а5 ]; 

} 


Если имеется подпрограмма деї Ғапі1у, возвращающая массив, ее можно исполь- 
зовать для заполнения ХНоА с помощью любого из следующих циклов: 


Рог $дгоир ( “з1ирзоп$”, јеїѕопѕ", “111 птзтопез” ) { 
$Нод{$9гоир} = [ дее_РатЛу($9гоир) 1; 
} 


Рог $огоир ( “51 трзопз”, "јеїѕопѕ", “Р11пе$топе$" ) { 
@петрегѕ = деё_Ғаті1у($9гоџр); 
ФНОА{$9гоир} = [ @тетьегз ]; 

} 


Новые члены можно дописать в существующий массив следующим образом: 


риѕћ @{ ФНОА{Ғ11піѕтопеѕ} }, м1іта , “реоб1е$”; 


Доступ к хешу массивов и вывод его элементов 
Присвоить значение первому элементу некоторого массива можно так: 
ФНОА{ #1іпїѕтопеѕ} [0] = “Егед”- 


Чтобы преобразовать первый символ в имени второго Симпсона в верхний ре- 
гистр, примените операцию подстановки к соответствующему элементу массива: 


ФНоА{ѕ2трѕоп5} [1] =- 5/(\м) /\0$1/: 
Вывести членов всех семейств можно, выполнив обход всех ключей хеша в цикле: 


Рог $Ғат у ( Ккеуѕ НОА ) { 
зау "ФҒаті1у: @{ $НоА{$Рат11у} }”; 
} 


Приложив дополнительные усилия, можно добавить также индексы массивов: 


Тог $Ғаті1у ( Кеуз УНоА } { 
ргіпі “ФҒаті1у: 7; 
Тог $1 ( 0 .. $ $НоА{$Ғаті1у} } ) { 
ргіпі “ $1 = ФНоА{$аті1у $11"; 
} 
ргіпЕ “\п"; 
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Или отсортировать массивы по числу элементов в них: 


Гог $Ғаті1у ( ѕогі { @{$Нод{$6}} <=> @{$Нод{$а]} } Кеуѕ Нод ) { 
зау "фҒатііу: @{ $НоА{$Ғаті1у} }” 
} 


Или даже отсортировать массивы по числу элементов, а затем упорядочить эле- 
менты в алфавитном порядке, в соответствии с таблицей АЗСП (точнее, и 8): 


# Вывести все, упорядочив по числу элементов и именам. 

Тог $Ғаті1у ( ѕогі { @{$НоА{$65}} <=> @{$НоА{$а}} } Кеуѕ ЯНол ) { 
Ѕау "ФҒаті1у: ”, јоіп(", ", зогЕ @{ $НоА{Фғаті1у} }); 

} 


Если фамилии содержат не-АЅСІ символы Юникода или какую-либо пунктуа- 
цию, сортировка по кодам символов не позволит получить алфавитный порядок. 
Вместо этого используйте следующий прием: 


изе Ип1соде: : Со11ате; 
пу $зогЕег = Џпісоде: :Со11ате->пем(); # обычная алфавитная соргировка 
зау "$Ғаті1у: ”, 

јоіп ”, " => $ѕогег->ѕогі( @{ $Нод{$ФРат11у} } ); 


Массивы хешей 


Массив хешей удобен, когда есть группа записей, для которых обращение осуще- 
ствляется последовательно, и каждая запись содержит пары ключ/значение. Мас- 
сивы хешей используются реже, чем прочие структуры, представленные в данной 
главе. 


Формирование массива хешей 
Создать массив анонимных хешей можно так: 


@АоН = ( 
{ 
Пизбапа => “Багпеу”, 
міғе => "реїїу”, 


Ее] => "ратт батт”, 
}, 
{ 
һиѕрапа => “деогде , 
мате => “јапе”, 
$0п => “е1гоу“, 
}, 
{ 
һиѕрапа => “помег”, 
міғе => “тагде” 
ѕоп => "рагі", 


}, 
): 


Чтобы добавить в массив еще один хеш, можно просто сказать: 


риѕћ @АоН, { һиѕрапа => "гей", міғе => “ила”, даџдћїег => "ребр1еѕ" }; 
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Генерирование массива хешей 


Вот несколько приемов заполнения массива хешей. Чтобы прочитать массив из 
файла следующего формата: 


һиѕбапд=?гед Ғгіепд=багпеу 
можно использовать один из двух следующих циклов: 


мһі1е ( <>) { 
фгес = {}, 
Рог ФРіе10 ( $р114 ) { 
(Фкеу, $уа1ие) = ѕр1ії /=/, $#іе10; 
$гес->{$Кеу} = $уа10џе, 
} 
ризп @Аон, $гес; 
} 


мһілЛе ( < ) { 
риѕћ @Аон, { ѕр11ї /[\з=]+/ }; 
} 


Если имеется подпрограмма 9е{_пех{_ра1г, возвращающая пары ключ/значение, ее 
можно применить для заполнения @АоН с помощью любого из следующих циклов: 


мһіле ( @ѓіе1бѕ = деї пехе_ра1"() ) { 
ризн @Аон, { @ғіе105 }; 
} 


мһі1е (<>) { 
ризн @Аон, { деЁ_пехе_ра1г($_) }, 
} 


Новые члены можно дописать в существующий хеш так: 


$АоНГО1{реї} = "діпо"; 
ФАоН[2]{реї} = "ѕапіа"ѕ 111%1е һе1рег” 


Доступ К массиву хешей и вывод его элементов 
Установить пару ключ/значение в некотором хеше можно так: 
$АОНГО }{һиѕрапа} = "Ғгед”; 


Чтобы преобразовать в верхний регистр первый символ в значении ключа һиѕрапа 
из второго массива, примените операцию подстановки: 


ФАоН[11]{һиѕбагпа} =- 5/(\м) /\и$1/; 
Вывести все данные можно так: 


Гог $һгеғ ( @Аон ) { 
ргапЕ “4 
Тог $го1е ( Ккеуѕ $һгеғ ) { 
ргіпі "$гоїе=$һгеғ->{$го1е} ”; 
} 
ргіпі “}\п”, 


Хеши хешей 


А вот так их можно вывести с индексами: 
Тог $1 (0.. $ФнАон ) { 


ргіпі "$1 1$ { "; 


Рог $го1е ( Кеуѕ %{ $АонН[$1] } ) { 
ргілі "$гоїе=$АонН[ $1 ]{$го1е} “* 


} 
ргіпЕ “}\п”; 
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Многомерный хеш является самой гибкой из вложенных структур Рец. Он напо- 
минает запись, содержащую другие записи. На каждом уровне хеш индексирует- 
ся строкой (в кавычках, если необходимо). Но не забывайте, что пары ключ/зна- 
чение извлекаются из хеша в произвольном порядке. Для извлечения пар в нуж- 
ном порядке можно использовать функцию 50гї. 


Формирование хеша хешей 


Хеш анонимных хешей можно создать так: 


НОН = ( 
Ғ1іпіѕТопеѕ => { 
һиѕрапа => 


ра1 => 
}, 
јеїѕопѕ => { 
һиѕрапа => 
мі?е => 
"пів Боу” => 


}, 


$1трзопз => { 


Визбапа@ => 
міғе => 
кіа => 


“Ғгед”, 
“багпеу”, 


“деогде”, 
“јапе“, 
“е1гоу" я Этот ключ должен быть закавычен 


“нопег“. 
“тагое”, 
рагї”, 


Чтобы добавить в ХНОН еще один анонимный хеш, можно просто сказать: 


ФНоН{ таѕћ } = { 


саріаіп => “р1егсе”, 
пајог => "ригпѕ” 
согрогаї => "гадаг”, 


}; 


Генерирование хеша хешей 


Вот несколько приемов заполнения хеша хешей. Чтобы прочитать содержимое 
файла такого формата: 


Е 1пезфопез: һиѕрапд=Ғгед ра1=багпеу міғе=мі1та реї=@іпо 


можно использовать один из следующих циклов: 
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м111е ( © ) { 
пехі ип1ез$ 8/7(. +7) :\5*//; 
$мћо = $1; 
Тог $11614 ( 5р1ії ) { 
($Кеу, $уа1ие) = ѕр11т /=/, $1е19; 
$Нон{Фипо} {Фкеу} = $ға1ие: 


} 


ме ( < ) { 

пехї ип1е55 5/7(. *?) :\5*//: 

$мћо = $1; 

$гес = {}; 

фНнон{Фипо} = $гес; 

Гог $11е19 ( ѕр11ї ) { 
($Кеу, Фуаше) = ѕр1іт /=/, $#1е19; 
$гес->{$Кеу} = $\уа1ие; 


} 


Если имеется подпрограмма еї _Ѓаті1у, возвращающая список пар ключ/значе- 
ние, ее можно использовать для заполнения %НоН с помошью одного из трех сле- 
дующих фрагментов: 


Тог $дгоир ( “з1трзопз”, "јеїѕопѕ", “Р11пЕ$фопе$" ) { 
$Нон{Фогоир} = { сеї _Ғаті1у($огоир) }; 
} 


Тог Фогоир ( “31рзоп$”, "јеїѕопз", "Ғ1іпїіѕїопеѕ” ) { 
@тетбегз = деі_Раті1у($огоир); 
$Нон{$9гоир} = { @тетрег$ }; 


} 
ѕир һаѕһ_Ғат11іеѕ { 
пу @гет, 
Рог $дгоир ( @_) { 
риѕћ @геї, $огоир, { деї_Ғаті1у($9го2р) 
} 
гефигп @гет; 
} 


НОН = Һаѕһ_Ғатіїіеѕ( ‘51трзопз”, “)ефзоп$”, "Ғ1іпїѕїопеѕ” ); 


Добавить новые члены в существующий хеш можно так: 


%пем_Ро1кѕ = ( 

міѓе => “мита”, 

ре => “аіпо"; 
); 
Рог $иһаї (Кеуз %пем_Ро1к$) { 

ФНоН{Ғ1іпіѕтопеѕ) {$ићаї)} = Фпем_Ро1К${$мпат}; 
} 


Доступ к хешу хешей и вывод его элементов 


Установить значение пары ключ/значение в хеше можно так: 


$НОН{Ғ11іпіѕїопеѕ} {м1Ре} = “мата”; 
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Чтобы преобразовать в верхний регистр первый символ в значении некоторого 
ключа, примените к соответствующему элементу операцию подстановки: 


ФНон{]етз0пз} { "61$ Боу’} =- $/(\м)/\0$/; 


Вывести членов всех семейств можно, выполнив в цикле обход ключей внешнего 
хеша, а затем ключей внутреннего хеша: 


Тог $Ғаті1у ( Кеуѕ %НоНн ) { 
ргіпі Ф$гаті1у: "; 
Тог $го1е ( Кеуз %{ $НоН{$Ғаті1у} } ) { 
ргіп “$го1е=$Нон{$Еат11у} {$го1е} “: 
} 
ргіпЕ “"\п"; 
} 
При работе с очень большими хешами немного быстрее будет одновременно из- 
влекать ключи и значения с помощью еаси (но это помешает сортировке): 


мһі1е ( (ФҒат1у, $го1еѕ) = еаси %ноН ) { 
рг1п "ФҒаті1у: “; 
мһіле ( ($го1е, $регѕоп) = еасһ %$го1ез ) { 
ргіпї “$го1е=Фрегзоп ” 
} 
ргіпі “\п”; 
} 


(К несчастью, именно большие хеши чаще всего приходится сортировать, в про- 
тивном случае в выводимых результатах невозможно будет найти нужную ин- 
формацию.) Отсортировать по семействам, а затем по ролям можно следующим 
образом: 


Ғог ФҒаті1у ( ѕогі Кеуз %НоН ) { 
ргіпі "$Рата1у. ” 
Тог $го]е ( зогЕ Кеуз %{ ФНоН{$Ғаті1у} г ) { 
ргіпі "$го1е=$ФНон{$Рата1у} {$го1е} ”; 
} 
ргіпі "\п"; 
} 
Чтобы отсортировать семейства по числу членов (а не по кодам АЗСП или 148), 
можно использовать кеуѕ в скалярном контексте: 


Рог $Ғаті1у ( зогт { кеуѕ %{$НоН{$а}} <=> кеуѕ %{$Нон{$6}} } Кеуз %Нон ) { 
ргіпі "ФҒаті1у` ”; 
Рог $го1е ( ѕогї Кеуз %{ ФНоН{$Ғаті1у} } ) { 
ргіпі "фгоіе=$НоН{$Ғаті1у} {$го1е} ": 
} 
ргіпЕ "\п”; 
} 
Чтобы отсортировать членов семейств в некотором фиксированном порядке, мож- 
но присвоить им ранги: 
$1 = 0; 
Рог ( ом(һиѕрапд міғе ѕоп даидНфег ра1 реї) ) { $гапк{$ } = ++$1 } 


Ғог фҒаті1у ( ѕогї { Кеуѕ Ж{ФНоН{$а}} <=> Кеуз %{$Нон{$6}} } Кеуз Нон ) { 


380 Глава 9. Структуры данных 


ргіпі “$ғаті1у: ”, 

Тог $го1е ( ѕогїт { $гапк{$а} <=> $гапк{$6} } кеуѕ %{ $Нон{$Рата1у} } ) { 
ргіпї "Фго1е=%НоН{ ФҒаті1у} {$го1е} “; 

} 


ризит “\п”; 


Хеши функций 


При создании сложного приложения или сетевой службы на языке Рег] может 
возникнуть необходимость предложить пользователям значительное число ко- 
манд. В такой программе для определения выбора пользователя и выполнения 
соответствующих действий может содержалжься код вроде следующего: 


зе ($ста =- /’ех11$/1) { ех1т } 
е151? ($стд =- /7һе1р%/1) { ѕһом һе1р() } 
е151ғ ($ста =- /"масһ$/1) { Фмаїсһ = 1 } 
е151ғ ($ста =- /7таі1$/3) { таі1 т59($т50) } 
е151іғ (Фста =- /7е011$/1) { $е011е4++; едіїтѕо($%т=0); } 
е151іҒ ($ст@ =- /7де1еїе$/і) { сопғігт_кі11() } 
е1ѕе { 
магп “Неизвестная команда: `$стб`; попробуйте вызвать пе1р’\п 


} 


Структуры данных способны хранить ссылки на функции точно так же, как ссыл- 
ки на массивы и хеши: 


УНоЕ = ( # Формирование хеша функций 
ехії => зи6 { ехії }, 
һеї1р => \5һом һе1р, 
мате => зиб { Фма+сһ = 1 }, 
таії => ѕир { таі1 тѕ0(%$т59) }, 
едії => ѕир { $е01{ед++: едіїтѕо(%т50): }. 
бе1ете => \&сопҒі гт_К111, 
); 


1Ғ ($НоЕ{1с $стд}) { $НоЕ{1с $ста}->() } # Вызов функции 
е15е { магп “ Неизвестная команда: $стд`; попробуйте вызвать ‘пе1р’\п } 


В предпоследней строке проверяется, существует ли указанное имя команды 
(в нижнем регистре) в «таблице ссылок», НоЕ. Если да, выполняется соответст- 
вующая команда за счет разыменования значения хеша как функции и передачи 
этой функции пустого списка аргументов. Разыменование можно было бы выпол- 
нить формой &{ $Ног{1с $спа} }() или. в версии Регі 5.6, просто $Но[{1с $стд}{). 


Более сложные записи 


До сих пор в этой главе мы имели дело только с простыми двухуровневыми одно- 
родными структурами данных, где каждый элемент содержит объект ссылки того 
же типа, что и остальные элементы этого уровня. Разумеется, это не является обя- 
зательным требованием. Любой элемент может содержать скаляр любого типа, т.е. 
может быть строкой, числом или ссылкой на что угодно. Ссылка может ссылать- 
ся на массив или хеп, псевдохеш, именованную или анонимную функцию или 
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объект. Единственное, чего нельзя сделать, это поместить в один скаляр несколь- 
ко объектов ссылки. Если вы поймали себя на попытке это сделать, значит, вам 
нужна ссылка на массив или хеш, чтобы объединить несколько значений в одно. 


В последующих разделах вы найдете примеры, иллюстрирующие хранение мно- 
гих возможных типов данных в записях, реализуемых с помощью ссылок на хеш. 
Ключами в них являются строки из символов верхнего регистра, — такое соглаше- 
ние иногда применяется, когда хеш выступает в качестве особого типа записи. 


Формирование, использование 
и вывод более сложных записей 


Следующая запись содержит шесть полей совершенно разных типов: 


фгес = { 
ТЕХТ => ф5ігіпд, 
ЅЕОЏЕМСЕ => [ @о10 уа1иез ], 
1 0ОКИР => { %зоте_гаые }, 


ТНАТСОВЕ => \ёѕоте_Ёипс+іоп, 
ТНІЅСОГЕ => ѕџр { $ [0] ** $. [11 }, 
НАМОЕ => \*5Т000Т, 
}; 
Поле ТЕХТ является обыкновенной строкой, поэтому его можно вывести так: 
ргіп $гес-> {ТЕХТ}; 
ЅЕОЈЕМСЕ и [ООКОР — это обычные ссылки на массив и хеш: 


ргіпі $гес->{$ЗЕСУЕМСЕ} [0]; 
ф1а5ї = рор @{ $гес->{ЅЕО0ЕМСЕ} }; 


ри1пЕ $гес-> {100КУР} {"Кеу"}; 
(Фіг к, $Е1г5 му) = еасһ %{ $гес->{100КУР} } 


ТНАТСОРЕ — это именованная подпрограмма, а 7Н15С00Е – анонимная подпрограмма, 
но вызываются они одинаково: 


фїһаї апѕмег = $гес->{ТНАТСООЕ}->($аг91, $агд2), 
ф1һіѕ_апѕмег = $гес->{ТНТЗСООЕ}->($агс1, $агд2); 


С помощью дополнительной пары фигурных скобок можно обращаться с $гес-> 
{НАМІЕ как с косвенным объектом: 


рг1пЕ { Фгес-> {НАМОЕ} } “строка\п”; 


А спомощью модуля 10::Нап1е с дескриптором можно обращаться как с обычным 
объектом: 


изе ТО: :Напа1е; 
$гес- > {НАМОЕ} ->аифо 1изи(1); 
$гес-> {НАМЕ} ->ргіпі( “строка\п”); 


Формирование, использование 
и вывод еще более сложных записей 


Естественно, что поля структур данных сами могут являться структурами дан- 
ных произвольной сложности: 
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%ТУ = ( 
Ғ11піѕїопеѕ => { 
ѕегіеѕ => “Ғ1іпїѕїопеѕ”, 
підһћіѕ => [ "попдау” "їһигѕдау", "Ғгідау” ], 
петбегѕ => [ 


{ пате => "Ғгед”, го1е => "һиѕрапа”, аде => 36, }, 
4 пате => “мі1ша", го1е => “міғе", аде -> 31, }, 
{ пате => “ребблез”, го1е => “Кіа”, аде => 4, }, 
], 
}, 
јеї50п5 0: 
ѕегіеѕ => “јеїѕопѕ", 
підһѕ => [ "медпеѕдау". “зафигдау” ] 
петрег= => [ 
{ пате => “деогде”, го1е => “һиѕрапа”, аде => 41, }, 
{ пате => “јапе“, то1е => “мі?е", аде => 39. }, 
{ пате => "е1гоу", гое => "кій", аде => 9, } 
1, 
}, 
51трѕопѕ => { 


ѕегіез => "ѕітрѕопѕ” 
1908 => [ "топдау" ], 
пепрегѕ => [ 


{ пате => “Потег”, го1е => “ПизБапб”, аде => 34, }, 
{ папе => "тагде", го1е => "мі?е’, аде => 37, }, 
{ пате => "багі". го1е => "кій". аде => 11, +. 


1. 
}, 
); 


Генерирование хеша сложных записей 


Поскольку Рег| хорошо справляется с анализом сложных структур данных, их 
можно поместить в отдельный файл в виде обычного кода нг языке Регі, а затем 
загружать с помощью встроенных функций 00 или "еди ге. Для загрузки произ- 
вольных структур данных, описанных на каком-нибудь другом языке (вроде 
ХМ, часто используются модули из СРАМ (например, ХМ! ::Рагзег). 


Структуры данных можно строить по частям: 
фгес = {}; 


$гес->{зег1ез} = "Ғ1іпіѕтопеѕ“ 
$гес-> {119015} = [ Ріпа дауѕ() ] 


Или читать их из файла (здесь предполагается использование формата поле=зна- 
чение): 


@тетрегз = (), 
ме (<>) { 
%11е109$ = $6118 /[\5=]+/; 
ризй @тетбегз, { %Ғіе105 } 
} 
$гес->{петбегз} = [ @зтбегз 1]; 
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Вкладывать в более крупные структуры, используя в качестве ключа одно из вло- 
женных полей: 


$ТМ{ $гес- >{зег1ез} } = $гес; 


Применение дополнительных полей с указателями помогает избежать дублиро- 
вания данных. Например, в запись о человеке можно включить поле "кійѕ” со 
ссылкой на массив, содержащий ссылки на записи с информацией о детях. Свя- 
зав части структуры ссылками (в противовес копированию), можно избежать на- 
рушения целостности данных в результате обновления лищь в одном месте из не- 
скольких необходимых: 


Тог $Ғаті1у (Кеуз %ТУ) { 
ту $гес = $ТУ{$Рат у}; # временный указатель 
@кійѕ = (); 
Тог Фрегзоп ( @{%гес->{тетрегѕ}} ) { 
1Е ($регѕоп->{го1е} =- /кід| ѕоп | даџдћтег/) { 
риѕћ @кіаѕ, $регѕоп; 
} 
} 
# $гес и $ТУ{$Ғаті1у} указывают на одни и те же данные! 
фгес->{кійѕ} = [ @кідѕ ], 
} 


Присваивание $гес->{кійѕ} = [ @К103 ] копирует содержимое массива — ссылки на 
некопируемые данные. Это значит, что, если увеличить возраст Барта: 


$Т\{31трзопз} {кідѕ} [0] {аде}++; # увеличивает до 12 


то, поскольку $Т\/{$1прз0п$}{К19$} [0] и $Т\{$1прз0п3} {шешбегз}[2] указывают на одну 
и ту же анонимную хеш-таблицу, мы увидим следующий результат: 


ргіпі $Т\/{31трзопз} {петбегз}[2]{аде}; # выведет 12 
Теперь выведем всю структуру %ТУ: 


Гог $Ғаті1у ( Кеуз %ТУ ) { 
ргіпі "тһе $Рата1у”; 
рип " 15 оп", јоіп (" апа “, @{ $ТУ{$ғаті1у}{підптѕ} }) 
ргіпі “11$ тетрегѕ аге:\п”, 
Рог Ф$иһо ( @©{ %ТУ{$ғаті1у)} {тетрегѕ} }) { 
ргіпЕ " $мпо->{пате} ($мпо->{го1е}), аде $ипс->{аде}\п 
} 
ргіпі “сһі10дгеп: , 
ргіпї јоіп (”, “, тар { $ _->{паме; } @{ %ТУ{$Ғат1у}{к1аѕ} } ) 
ргіпі “\п\п": 


Сохранение структур данных 


Если потребуется сохранить структуры данных для использования в дальней- 
шем другой программой, сделать это можно несколькими способами. Проще все- 
го применить модуль Ре! 0аїа::Вбипрег, преобразующий структуру данных (воз- 
можно, содержащую ссылки на саму себя) в строку, которую можно сохранить во 
внешней памяти и впоследствии реанимировать с помощью ема] или 00. 
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иѕе Дата: :Випрег; 

$0ата : :Ритрег: :Ригіїу = 1; Е поскольку ТУ содержит ссылки на себя 
ореп (ЕЕ, “> +уіпғо.рег1даїа”) || де “невозможно открыть Ф\улпРо: $! "; 
ргіпї ЕЦЕ рата: :битрег->Витр( [\%ТУ], Г '+*ТУ' ]); 

сІоѕе(ғ11Е) || дзе “невозможно закрыть їміпѓо: $! 


Отдельная программа (или та же самая) может позже прочитать этот файл: 


ореп (ЕШЕ, “< +уіпҒо.регідаїа”) || діе “невозможно открыть їміпёо: $! "; 


ипдеѓ $/; # прочитать файл целиком 

ема1 <ЕТЕЕ>; # воссоздать %ТУ 

91е “невозможно воссоздать данные іу из їуіпѓо.рег1дата $6” 1? $6; 
с105е(ЕТЕЕ) || 01е "невозможно закрыть їміпѓо: $: “: 


ргіпі $ТУ{ѕітрѕопѕ } {тепбе' 3}[2]{аде}; 
или просто: 


до “уіпғо. рег1дата” || бле “ невозможно воссоздать тулп®о: $! $0"; 
ргіпЕ ФТУ { ѕітрѕопѕ} {тетбегѕ}[2]{аде}: 


Ѕїогаб1е, другой стандартный модуль, записывает структуры данных, упаковы- 
вая их в двоичный формат, пригодный для быстрой обработки. Он также поддер- 
живает автоматическую блокировку файла (при условии, что ваша система реа- 
лизует функцию ѓ1осК) и даже предлагает точки перехвата (ћҺооКѕ), чтобы объек- 
ты могли сами выполнять сериализацию. Ниже показано, как ту же структуру 
сохранить с помощью модуля Ѕї0огаб1е: 


изе Зфогаб1е ом(1оск_пзіоге), 
10ск_пэфоге(\%Т\, “Еудата. ѕїогар1е"); 


А следующий фрагмент демонстрирует чтение структуры из файла в перемен- 
ную. После выполнения этой операции в переменной $Т\ геї окажется ссылка на 
извлеченный хеш: 


изе Ѕїогаб16е ом(1оск_геігіеуе); 
$ТУ геѓ = 10ск_геїгіеме( "імбата. зтогаве”); 


Модуль Ѕїіогаб1е также предлагает функцию г 1077, создающую «глубокие» ко- 
пии многоуровневых структур данных. Как правило, воспользоваться этой функ- 
цией намного проще, чем писать собственный вариант. 


изе Этогаб1е ом(дс1опе); 
%Т\У сору = % { дс1опе \%ТУ }; 


Другие фокусы с применением модулей Вата: :Витрег и 5їогаб1е описаны в докумен- 
тации этих модулей. 


Есть много других решений записи данных в разных форматах – от упакованного 
двоичного (очень быстрого) до ХМГ (широко совместимого). Отличным выбором 
может оказаться промежуточное решение — формат УАМГ,, обладающий вполне 
приемлемой удобочитаемостью. Сегодня же посетите ближайшее зеркало СРАМ! 


Пакеты 


В этой главе мы добрались до приятных вещей, поскольку речь пойдет о проекти- 
ровании программного обеспечения. В разговоре о качественном проектирова- 
нии программного обеспечения никак не обойтись без таких базовых для проек- 
тирования тем, как Лень, Нетерпеливость и Высокомерие. 


Мы все попадали в ловушку и бездумно копировали код (сиќ-апа-раѕіе), когда 
следовало бы определить абстракцию более высокого уровня, пусть даже такую 
простую, как обычный цикл или подпрограмма.! Многим наверняка доводилось 
впадать в противоположную крайность, нагромождая горы абстракций более вы- 
сокого уровня, когда надо было лишь скопировать код через буфер обмена.? И все 
же большинству из нас следует подумать о том, чтобы использовать абстракции 
почаще. 


Промежуточное положение занимают приверженцы взвешенного подхода к при- 
менению абстракций, которые, однако, слишком рано бросаются создавать собст- 
венные абстракции, когда следовало бы повторно использовать имеющийся код.3 
Испытав соблазн сделать что-либо из перечисленного, сделайте перерыв и поду- 
майте, что в долгосрочной перспективе окажется лучше всего для вас и вашего 
ближнего. Если вы хотите излить свою творческую энергию в программе, почему 
бы при этом не сделать мир совершеннее? (Даже если вашей единственной целью 
является успех программы, вы должны убедиться, что она займет нужную эко- 
логическую нищу.) 


Первый шаг на пути к экологически устойчивому программированию очень 
прост: не надо мусорить в парке. Когда вы пишете некоторый код, задумайтесь 
о создании для него собственного пространства имен, чтобы ваши переменные 
и функции никому не помешали, и наоборот. Пространство имен немного похоже 


Это разновидность Ложной Лени. 
Это разновидность Ложного Высокомерия. 


Вы угадали: это Ложная Нетерпеливость. Но если вы намерены изобретать заново ко- 
лесо, постарайтесь хотя бы, чтобы ваше колесо было более удачным. 
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на ваш собственный дом, в котором можно быть сколь угодно неряшливым, со- 
блюдая, конечно, во взаимодействии с прочими гражданами достаточные прили- 
чия. В Рей пространство имен называется пакетом (раскаве). Пакеты – это базо- 
вые кирпичики, из которых сооружаются понятия модулей и классов, находя- 
щиеся на более высоком уровне. 


Как и понятие «дом», понятие «пакет» несколько туманно. Пакеты не зависят от 
файлов. Можно иметь много пакетов в одном файле и один пакет, охватывающий 
несколько файлов, точно так же, как ваш дом может быть маленькой мансардой 
в большом здании (если вы – голодающий художник), а может состоять из не- 
скольких зданий (если вас зовут королева Елизавета). Но обычный размер дома — 
одно здание, а обычный размер пакета — один файл. Рег оказывает особую по- 
мощь тем, кто хочет поместить пакет в один файл, если только они согласны дать 
файлу то же имя, что и пакету, и использовать расширение „рт, что представляет 
собой сокращение от «рег тодШе». Модуль является в Ре фундаментальной 
единицей повторного использования кода. На практике обращение к модулю осу- 
ществляется с помощью инструкции изе, управляющей импортом подпрограмм 
и переменных из модулей. Все случаи применения изе, встречавшиеся в тексте 
книги до сих пор, были примерами повторного использования модулей. 


Архив Рей (Сотргерепзуе Ре АгсШуе МеёмогК, или СРАМ) – то место, где вам 
следует публиковать свои модули, если вы считаете, что они могут оказаться по- 
лезными другим. Процветание Ре! вызвано стремлением программистов делить- 
ся плодами своего труда с обществом. Естественно, в СРАМ можно найти модули, 
заботливо помещенные туда другими для всеобщего пользования. Подробности 
читайте в главе 19 и на сайте РНр://шиль.срап.огв. 


Тенденцией последних примерно 25 лет была разработка языков программирова- 
ния, навязывающих состояние паранойи. Предполагается, что каждый модуль 
вы должны программировать так, будто он находится в положении осады. Конеч- 
но, существуют феодальные культуры, где такой подход уместен, но не все куль- 
туры таковы. В культуре Рей, к примеру, предполагается, что вы не залезаете 
в чужой дом потому, что вас не приглашали, а не потому, что на окнах решетки.! 


Эта книга не посвящена объектно-ориентированным технологиям, и мы не соби- 
раемся обращать вас в неистового фанатика объектной ориентированности, даже 
если вы этого хотите. Для этого уже написано множество книг. Философия Рег] 
в отношении объектно-ориентированной разработки соответствует его филосо- 
фии в отношении всего прочего: прибегать к объектно-ориентированной разработ- 
ке там, где это имеет смысл, и избегать там, где этого смысла нет. Выбор за вами. 


На жаргоне ООП каждый объект принадлежит объединению, называемому клас- 
сом. В Рей классы, пакеты и модули так тесно связаны, что новичкам часто ка- 
жется, будто они взаимозаменяемы. Типичный класс реализуется модулем, в ко- 
тором определен пакет, имя которого совпадает с именем класса. Все это мы разъ- 
ясним в нескольких последующих главах. 


Применение модулей дает преимущество непосредственного повторного исполь- 
зования программного обеспечения. А классы обеспечивают преимущество кос- 
венного повторного использования программного обеспечения, когда один класс 


1 Однако в Реп есть и решетки, если они вам нужны. См. раздел «Работа с небезопасным 
кодом» главы 20. 
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использует другой посредством наследования. А еще классы позволяют осущест- 
влять чистое взаимодействие между пространствами имен. Доступ ко всему, что 
находится в классе, осуществляется косвенным образом, изолируя класс от внеш- 
него мира. 


Как упоминалось в главе 8, объектно-ориентированное программирование в Ре 
реализуется через ссылки, объекты которых «знают», к какому классу они при- 
надлежат. Фактически, теперь, когда вы знаете о ссылках, вы знаете почти обо 
всем сложном, что связно с объектами. В остальном «пальцы сами ложатся на 
нужные ноты», как сказал бы пианист. Конечно, нужно немного попрактико- 
ваться. 


Одно из основных упражнений для пальцев состоит в том, чтобы научиться защи- 
щать различные фрагменты кода от непреднамеренного взаимного воздействия 
на переменные. Каждый участок кода относится к определенному пакету, кото- 
рый определяет, какие переменные и подпрограммы ему доступны. Когда Рей 
встречает фрагмент кода, то компилирует его в область, которая называется те- 
кущим пакетом. Первоначальный текущий пакет называется «тат», но в лю- 
бой момент вы можете переключить текущий пакет на другой с помощью объяв- 
ления раскаде. Текущий пакет определяет, какая таблица имен используется для 
поиска переменных, подпрограмм. дескрипторов ввода/вывода и форматов. 


Таблицы имен 


Содержимое пакета в совокупности называется таблицей имен (зутбо] їаЫе). 
Таблица имен хранится в хеше, имя которого совпадает с именем пакета, но до- 
полнено двумя двоеточиями. Таким образом, именем таблицы для паіп служит 
Ф%таіп::. Поскольку паіп является пакетом по умолчанию, Регі допускает сокра- 
щенное имя %:: для %таіп::. 


Аналогично, таблица имен для пакета Ћей::В1џие носит имя %Веод: :В1ие::. Таблица 
имен паіп содержит все остальные таблицы имен верхнего уровня, включая саму 
себя, поэтому Вес: :В1ие:: одновременно является Хпаіп: :Вед: :В1ие::. 


Когда мы говорим, что таблица имен содержит другую таблицу имен, мы имеем 
в виду, что она содержит ссылку на другую таблицу имен. Поскольку пап являет- 
ся пакетом верхнего уровня, он содержит ссылку на самого себя, поэтому %та1п:: 
это то же самое, что и %та1п пта1г , и %та1п::та1г па1п::, и так до бесконечности. 
Этот особый случай важно учитывать при написании кода, который обходит все 
таблицы имен. 


В хеше таблицы имен каждая пара ключ/значение устанавливает соответствие 
между именем переменной и ее значением. Ключи представляют собой символь- 
ные идентификаторы, а значения являются соответствующими ёурер1об. Поэто- 
му посредством обозначения *ЛАМЕ $уреё]оЪ мы, в действительности, просто обра- 
щаемся к значению в хеше, который содержит таблицу имен текущего пакета. На 
практике следующие строки имеют (почти) одинаковый эффект: 


*зут = *паіп: :уагіар1е; 
*зут = $таіп: : {"магіаБ1е"}; 


Первая строка более эффективна, потому что доступ к таблице имен паіп может 
осуществляться уже на этапе компиляции. Она также создает новый $уреё1оь 


388 Глава 10 Пакеты 


с указанным именем, если его еще не существует, тогда как вторая форма этого не 
делает. 


Поскольку пакет представляет собой хеш, можно найти ключи пакета и полу- 
чить все его переменные. А так как значения хеша являются фуреё]оБ, разымено- 
вывать их можно несколькими способами. Например, так: 


Ғогеасһ $зутпате (ѕогі Кеуз Жта1п::) { 
1оса1 *ѕут = $паіп: : {$ѕутпате}; 
ргіпі “\Ффѕутпате определен\п” і? деғіпед $ѕут; 
ртіпі “\@$ѕутпате не нуль\п” 11 @ѕут; 
ргіпї “\Жѕутпате не нуль\п” і? %ѕут; 
} 


Все пакеты доступны (прямо или косвенно) через пакет паіп, поэтому можно на- 
писать код Регі, который обойдет все переменные программы. Именно это делает 
отладчик Рей, когда вы запрашиваете у него снимок переменных посредством 
команды \/. Заметьте, что при этом не будут видны переменные, объявленные 
с помощью пу, поскольку они не зависят от пакетов, но будут видны переменные, 
объявленные через сиг. См. главу 18. 


Ранее мы сказали, что только идентификаторы могут храниться в пакетах, от- 
личных от паіп. Это маленький обман: в качестве ключа в хеше таблицы имен 
можно указать любую строку, просто Рей не допустит непосредственного исполь- 
зования строки, не являющейся идентификатором: 


$1 @#$% = 0; # НЕВЕРНО, синтаксическая ошибка. 
${°104$%°} = 1; # порядок, хотя имя не полное. 
${ `таіп: : 1 @#$%'} = 2; # Можно уточнять имя в строке. 


ргіпі ${ Ф$та1п:: {`1@8$%'} } # порядок. выводит 2! 


Присваивание іурев1ор осуществляет операцию создания псевдонима; т.е. после 
выполнения 


*01СК = *гісһагд; 


переменные, подпрограммы, форматы, дескрипторы файлов и каталогов, доступ- 
ные через идентификатор г1спагао, оказываются доступными и через имя (іск. 
Чтобы создать псевдоним только для конкретной переменной или подпрограм- 
мы, используйте ссылку: 


*діск = \$гісһагд, 
В результате $г1сһага и $0іск становятся одной и той же переменной, но @г1спа"д 
и @0іск остаются разными массивами. Хитро, а? 
Вот как работает Ехрогїег при импорте имен из одного пакета в другой. Например, 


*ЅопеРаск: :діск = \01һегРаск: : гісһага, 


импортирует функцию ёгісһага из пакета ОїһегРаск в пакет ботеРаск, делая ее дос- 
тупной под именем &0іск. (Модуль Ехрогїег описан в следующей главе.) Если пред- 
варить это присваивание ключевым словом 10са1, псевдоним будет действовать 
только до конца текущей динамической области видимости. 


Этот механизм может применяться для извлечения ссылки из подпрограммы, де- 
лая объект ссылки доступным в качестве соответствующего типа данных; 
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*џипіїѕ = рори1ате() # Присвоить \Жпемһаѕћ объекту фуред1о6 
ргіпЕ $ип1ї5{ ко}; # Выведет 70; разыменование не требуется! 


зию рори1а+е { 
ту %пемһаѕћ = (кт => 10, Ка => 70); 
гетигп \%пемпазН; 


} 


Аналогично можно передать ссылку в подпрограмму и использовать ее без разы- 
менования: 


%ипісѕ = (т11е$ => 6, ѕїопеѕ => 11); 
Ғі11егир( \%ипіїѕ ); # Передача ссылки 
ргіпЕ $ипіїѕ {диагї$}, # Выведет 4 


ѕир #і11егир { 
1оса1 *һаѕһѕут = $һіҒЕ, # Присвоить \жип1їѕ объекту Туред1о6 
$һаъһѕут{иагЁѕ} = 4; й Действует на %ип1{$; разыменование не требуется! 


} 


Это хитрые приемы для передачи ссылок без лишних затрат, когда вы не хотите 
явно их разыменовывать. Обратите внимание на то, что оба приема работают толь- 
ко с переменными пакета; их нельзя использовать, если объявить Фип $ как пу. 


С помощью таблиц имен можно также создавать «константы»-скаляры: 
*РТ = \3. 1415926535897: 


Теперь изменить $РІ нельзя, что, вообще-то, правильно. Это не то же самое, что 
подпрограмма-константа, оптимизируемая на этапе компиляции. Подпрограм- 
ма-константа – это такая подпрограмма, в прототипе которой указано, что она не 
принимает аргументов и возвращает постоянное выражение; подробности можно 
найти в разделе «Подставляемые функции-константы» главы 7. Удобным сокра- 
щением является использование прагмы изе сопзтап{ (см. главу 29): 


изе сопзфапе РТ => 3. 14159, 


Технически при этом используется место для подпрограммы *РІ, а не место для 
скаляра, как ранее. Это эквивалентно более компактной (но не столь прозрачной) 
записи: 


*РТ = ѕир () { 3.14159 } 


В любом случае, полезно знать эту идиому: присваивание ѕир {} объекту фуреё1о6 
является способом дать имя анонимной подпрограмме на этапе выполнения. 


Присвоить ссылку на фуре21оь другой переменной $уре21оь (*зут = \*019уаг) озна- 
чает то же самое, что присвоить $уре210 целиком, потому что Ре! автоматически 
разыменовывает ссылку на фуреё1оЪ. А когда объекту $урей10оЪ присваивается 
обычная строка, она становится именем фуреё1оЬ в целом, потому что Рег] ищет 
строку в текущей таблице имен. Все нижеследующие строки эквивалентны меж- 
ду собой, но первые две вычисляют элемент таблицы имен на этапе компиляции, 
а две последние - на этапе выполнения: 


*ѕут = *010\аг; 
*зут = \*019\аг; # автоматическое разыменование 
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*ѕуп = *{"010уаг"}; н явный поиск в таблице имен 
*зут = “014\аг”; # неявный поиск в таблице имен 


Осуществляя любое из следующих присваиваний, мы заменяем только одну 
ссылку внутри іуреғ1оЬ: 


«зум = \$годо; 
*Ѕут = \@ѕап; 

*ѕут = \%иеггу; 
*зут = \&рірріп; 


Если взглянуть на это со стороны, то фуреё1оЪ можно рассматривать как хеш, со- 
держащий записи для различных типов переменных. В данном случае ключи 
фиксированы, поскольку Ёуреғ1оЬ может содержать ровно один скаляр, один мас- 
сив, один хеши т.д. Но можно извлекать отдельные ссылки: 


*рко: : ѕутіЅСАГАВ} 
*рка: : зут{АВВАУ } 
*рКа : : ѕуп{ НАЅН} 
*рко: : 5ут{С00Е} 
*рка: :$ут{ 6108} 
*рко: :ѕут10} 


то же, что \$рко: : зум 

то же, что \@рко: :ѕут 

то же, что \Жрко: :ѕут 

то же. что \&рко: :ѕут 

то же, что \*рко: :ѕут 

внутренний дескриптор файла/каталога, 

# нет прямого эквивалента 
«рка: : зут{МАМЕ} # “ѕут" (не ссылка) 
*рко: : зут{РАСКАСЕ} # "рко” (не ссылка) 


= == 


Выражени»н *Гоо{РАСКАСЕ} и *«Гоо{МАМЕ} позволяют узнать, каковы имя и пакет для 
элемента таблицы имен *Гоо. Это может оказаться полезным в подпрограмме. по- 
лучающей $уреР]оь в качестве аргументов: 


зи 1аепт1Ру_туред1о6 { 
пу $9106 = $1111; 
ргіпї ‘Вы передали мне ° *{$9100} {РАСКАСЕ} *{$9100} {МАМЕ}, “\п”; 
} 
ідепііғу Туред1об( +оо); 
ідепіі Ру +уред1оЫ( •баг: :дЈагсһ); 


В результате будет выведено: 


Вы передали мне паіп: : Ғоо 
Вы передали мне баг: :д1агсһ 


Форму записи *Ғоо{ТНІМС) можно использовать для получения ссылок на отдель- 
ные элементы »*Гоо. Подробности см. в разделе «Ссылки на таблицы имен» главы 8. 


Этот синтаксис служит, в основном, для получения внутренней ссылки на де- 
скриптор файла или каталога, поскольку другие внутренние ссылки можно по- 
лучить иным способом. (Прежнее »Ѓоо{ РІ ЕНАМ0ІЕ; более не поддерживается в зна- 
чении *Г00{10}.) Но мы решили, что следует обобщить его, поскольку он выглядит 
довольно симпатично. Скорее всего, вам не нужно все это запоминать, если толь- 
ко вы не собираетесь написать новый отладчик Рег]. 


Квалифицированные имена 391 


Квалифицированные имена 


На идентификаторы! в других пакетах можно ссылаться, предваряя идентифи- 
каторы именем пакета и парой двоеточий: $Пакет: :Переменная. Это мы называем 
«квалифицировать» идентификатор. Если имя пакета опущено, предполагается, 
что речь идет о пакете паіп. Это значит, что $::5а11 эквивалентно $та1п::$а11.2 


В прошлом разделителем идентификатора и пакета служила одинарная кавычка, 
поэтому в старых программах на Рег можно увидеть переменные типа $та1п'за11 
и $ѕотераск'ћогѕе. Но сейчас предпочтительным разделителем является двойное 
двоеточие — отчасти потому, что его легче читать человеку, отчасти потому, что 
его легче читать макросам етасз. Он также создает у программистов на С++ впе- 
чатление, будто они понимают, что происходит, тогда как одинарная кавычка ре- 
шала ту же задачу для программистов на языке Ада. Поскольку старомодный 
синтаксис все еще поддерживается для обратной совместимости, в строке вроде 
"Тһіѕ 1$ $омпег'ѕ Поизе” будет выполнено обращение к $0мпег::5; т.е. переменной $5 
из пакета омпег, чего вы, возможно, не желали. Двусмысленности можно избе- 
жать при помоши фигурных скобок. например "ТН:$ 1$ ${омпег}'ѕ Поизе". 


Двойное двоеточие может применяться для связывания в цепочку идентифика- 
торов в имени пакета: $Вед: :ВТие: :уаг. Это обозначает переменную $\аг, принадле- 
жащую пакету Нед: :В1ие. Пакет Вед: :В1ие не имеет никакого отношения к возмож- 
но существующим пакетам Вед или В1ие. То есть, отношения между Вед: :В1ие и Вед 
или В1џе могут существовать для того, кто пишет или использует программу, но 
они не существуют с точки зрения Реп. (Кроме того обстоятельства, что в теку- 
щей реализации таблица имен Вед: :В1ще хранится в таблице имен Вей. Но язык 
Ре! этим обстоятельством напрямую не пользуется.) 


Когда-то переменные, начинавшиеся символом подчеркивания, принудительно 
помещались в пакет паіп, но потом мы решили, что авторам пакетов удобнее при 
помощи ведущего символа подчеркивания обозначать полузакрытые идентифи- 
каторы, предназначенные только для использования внутри пакета. (Подлинно 
закрытые переменные могут быть объявлены как лексические с областью види- 
мости «файл», но это лучше всего работает, когда между пакетом и модулем име- 
ется взаимно однозначное соответствие, что случается часто, но не является обя- 
зательным требованием.) 


Хеш %510 (предназначенный для перехвата сигналов; см. главу 15) тоже является 
особым. Если определить обработчик сигнала как строку, то она будет указывать 
на подпрограмму в пакете паіп, если только явно не указано имя другого паке- 
та. Указывайте полностью квалифицированное имя обработчика сигнала, если 


1 Под идентификаторами мы подразумеваем имена, служащие ключами таблицы имен 
для доступа к скалярным переменным, переменным массивов, переменным хешей, под- 
программам, дескрипторам файлов и каталогов и форматам. Если говорить о синтакси- 
се, метки тоже являются идентификаторами, но они не помещаются в какую-либо таб- 
лицу имен, а непосредственно прикрепляются к командам программы. Метки не могут 
квалифицироваться именем пакета. 


2 Чтобы избежать возможной путаницы, в имени переменной типа $та1п::3а:1 мы ис- 
пользуем термин «идентификатор» для паіп и за11, но не для паіп::ѕаі1. Мы называем 
такую конструкцию именем переменной, потому что идентификаторы не могут содер- 
жать двоеточий. 
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хотите указать конкретный пакет, или вообще избегайте использования строк, 
осуществляя вместо этого присваивание їуреё1оЬ или ссылки на функцию: 


ф5ІС{(00ІТ} = "Рко::90ії саїсһе:” # квалифицированное имя обработчика 


$516{0011} = "диії саїсһег”; # подразумевается “та1п: :9и1%_сафспег” 

$5І6{00ІТ} = *дџії саїсћһег, # устанавливает зиб из текущего пакета 

$510{00ІТ} = \&дџії саїспег; # устанавливает зиб из текущего пакета 

$516{001Т} = ѕир { ргіпі “Перехвачен 5160017\п” }, # анонимная ѕиб 
Пакет по умолчанию 


Пакетом по умолчанию является пап, то же имя, что назначено главной функ- 
ции программы на языке С. Если явно не определено иное, все переменные ока- 
зываются в этом пакете. Следующие строки являются идентичными: 


#1 /иѕг/б1п/рег1 


$папе = ‘Апе1іа`; 
$таіп: :пате = Ате]1а`; 


$+уре = ‘Сате1`; 
$таіп: :+уре = Самет‘; 


В области действия прагмы ѕїг1ст необходимо явно определять пакет, поскольку 
эта прагма не позволяет использовать необъявленные переменные: 


#1 /изг/61пт/рег1 
иѕе №5. 12; 


$пате = Атела’, # ошибка компиляции 
$таіп: :пате = ‘Ате]за’; 


$туре = ‘Сате1`; # ошибка компиляции 
фтаіп: :+уре = Сатеі `; 


В таблице имен пакета хранятся только идентификаторы (имена, начинающиеся 
с буквы или символа подчеркивания). Все остельные имена хранятся в пакете 
паіп, в том числе все небуквенные переменные, такие как $!, $? и $_.! Кроме того, 
идентификаторы ЭТОТМ, ЭТООИТ, ЗГОЕВВ, ААСУ, АЯСУОЧТ, ЕМУ, Т№ и 516, если они не ква- 
лифицированы, принудительно помещаются в пакет паіп, даже если использу- 
ются для других целей, нежели их встроенные тезки. Не называйте свои пакеты 
т, 5, у, їг, 0, 00, 97, ам или дх, если только не хотите нажить себе множество непри- 
ятностей. Например, вы не сможете использовать квалифицированную форму 
идентификатора в качестве дескриптора файла, поскольку она будет интерпрети- 
рована как поиск по шаблону, подстановка или транслитерация. 


1 Однако, начиная с у5.10 допускается создание переменных $ с лексической областью 
видимости. 
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Изменение пакета 


Понятие «текущего пакета» относится и к этапу компиляции, и к этапу выполне- 
ния. Большинство операций поиска имен переменных происходит на этапе ком- 
пиляции, а поиск на этапе выполнения случается при разыменовании символи- 
ческих переменных, а также когда новые фрагменты кода анализируются при 
выполнении еза]. В частности, когда ема1 применяется к строке, Регі знает, в ка- 
ком пакете была вызвана е\а1, и распространяет действие этого пакета на кон- 
текст обрабатываемой строки. (Конечно, внутри строки е\а1 всегда можно пере- 
ключиться в другой пакет, поскольку строка е\уа1 считается блоком, как и файл, 
загруженный с помощью йо, геди1ге или изе.) 


По этой причине каждое объявление раскаде должно содержать полное имя паке- 
та. Для имен пакетов не существует каких-либо неявных «префиксов», даже если 
пакет объявляется внутри объявления некоторого другого пакета. 


С другой стороны, еуа1 может узнать, в каком пакете находится ее вызов, с помо- 
щью специального символа _ РАСКАСЕ__, в котором содержится имя текущего па- 
кета. Поскольку с этим символом можно обращаться как со строкой, он может 
фигурировать в символической ссылке для доступа к переменной пакета. Но в та- 
ком случае, вероятно, следовало бы объявить переменную с ключевым словом оиг 
и обращаться к ней как к лексической переменной. 


Любые переменные, не объявленные с ключевым словом пу, ассоциируются с па- 
кетом – даже кажущиеся вездесущими переменные типа $_ и %510. Другие пере- 
менные ассоциируются с текущим пакетом, если они не квалифицированы: 


$пате = ‘Ате]1а’; # имя в текущем пакете 


ФАпіта1: :пате = `Сате1іа`: # имя в пакете Ап1та1 


Объявление раскаде изменяет пакет по умолчанию до конца области видимости 
(блока, файла или еха1) или пока не встретится другое объявление раскаде на том 
же уровне, замещающее прежний пакет (что является распространенной практи- 
кой): 


раскаде Ап1та1; 
Фпате = Сате]ла` # $Апіта1 .пате 


Важно отметить и еще раз подчеркнуть, что объявление раскаде нє создает об- 
ласть видимости, поэтому оно не способно скрыть лексические переменные в той 
же области видимости: 


ту $+уре = Сапе] '; 
раскаде Апіта1; 


ргіпт Туре 19 $1уре\п"; #8 лексическая $їуре, поэтому "Сапе1` 
Фтуре = Нат’; 


раскаде 700; 


ргіпі "Туре 1$ $Еуре\п”; # лексическая $їуре, поэтому “Ват” 
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Чтобы отдать предпочтение переменной с тем же именем, принадлежащей паке- 
ту, используйте оџг. Но будьте осторожны. В результате переменная из текущего 
пакета будет использоваться по умолчанию до конца области видимости, даже 
если пакет по умолчанию изменится: 


ту $Еуре = "Сате1`; 
раскаде Апата1; 


сиг $+уре = `Ват’; 
ргіпі "Туре 1$ $фуре\п", # переменная $уре из пакетг, поэтому “Ват” 


раскаде 700; 


ргіпї “Туре 1$ $Фуре\п”, # переменная $+уре из пакета Апіта1, поэтому "Ват 


В пакете 2700 имя $їуре все еще представляет переменную $Апіпа1::їуре. Область 
действия объявления ог простирается до конца области видимости, а не до конца 
области действия объявления пакета. Это может вносить некоторую путаницу. 
Запомните, что объявление раскаде изменяет только имя пакета по умолчанию: 
оно не начинает и не заканчивает область видимости. После изменения пакетғ 
все последующие необъявленные идентификаторы будут помещаться в таблицу 
символов, принадлежащую текущему пакету. Вот так-то. 


Обычно объявление раскаде является первой командой в файле, который должен 
включаться посредством гедџіге или изе. Но, опять-таки, это лишь соглашение. 
Объявление раскаде можно поместить в любое место, где допустим оператор. Мож- 
но даже поместить его в конце блока, и тогда оно вообще не будет иметь никакого 
эффекта. Можно переключать пакет в нескольких местах; объявление пакета 
просто выбирает таблицу имен, которая будет использоваться компилятором 
в оставшейся части блока. Этот способ позволяет создать пакет, охватывающий 
более одного файла. 


В последних версиях Регі можно указывать версию пакета в строке с объявлени- 
ем раскаде: 


раскаде 400 \%3.1.4; 


Кроме того, в Рек у5.14 и более поздних версий допускается заключать пакеты 
в фигурные скобки, что делает их более похожими на блоки. Это позволяет огра- 
ничить область видимости пакета границами блока. Используя эту особенность, 
можно избежать проблемы утечки имен, описанной выше: 


ту $Туре = 'Саме1”; 


раскаде Апіта1 { 
оџг $+уре = `Ват’, 
ргіпі "Туре 15 $№уре\п”; # переменная $Фуре из пакета, поэтому “Нат” 


раскаде 200 \3.1.4 { 
ргіпї "Туре 1$ $№уре\п"; # внешняя переменная $+уре, поэтому “Сате1“ 
} 
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Обычно невозможно вызвать подпрограмму, которая не определена. Однако если 
в пакете с неопределенной подпрограммой (или, если речь идет о методе объекта, 
в пакете любого из базовых классов объекта) содержится подпрограмма с именем 
АОТОЕОАО, подпрограмма АТО ОАО вызывается с теми же аргументами, которые были 
бы переданы исходной подпрограмме. Можно определить подпрограмму АУТОШАВ 
так, чтобы она возвращала значения как обычная подпрограмма или заставить ее 
определить отсутствующую подпрограмму, а затем вызвать новую подпрограмму, 
как будто она существовала до вызова АОТОГОАТ. 


Полностью квалифицированное имя исходно не существовавшей подпрограммы 
чудесным образом появляется в $АИТОГОАО — глобальной переменной того же паке- 
та, в котором находится подпрограмма АИТ! ОАц. Вот простой пример, который де- 
ликатно предупреждает вас о вызове неопределенной подпрограммы, вместо того 
чтобы осуществить выход: 


зи6 А0ТОГОАРр { 
оиг ФАУТОЦОАО; 
маги “Попытка вызвагь ФАОТОГОАО не удалась. \п"; 


} 


Б1аго(10); # наша ФАУТОГОАВ получит значение талп: :б1аго 
рг1пф "Продолжаем работу! \п” 


Либо можно вернуть значение от имени неопределенной подпрограммы: 


ѕиб АОТОГОАр { 

оиг ФАЦТОГОАР; 

гетигп "Я вижу $АОТОГОАр(@ )\п"; 
} 


ргіпі 61аго(20); # выведет: Я вижу па1п: :01аго(20) 


Ваша подпрограмма АО'ТОГОА может загрузить определение для неопределен- 
ной подпрограммы с помощью еуа1 или гедит ге либо прибегнуть к обсуждавшему- 
ся выше приему с присвоением 2106, а затем выполнить эту неопределенную под- 
программу с применением специальной формы 9010, которая может без следа сте- 
реть запись активации подпрограммы АЙТО!ОАО. Сейчас мы определим подпро- 
грамму, присвоив замыкание переменной 2105: 


зиб АЦТОЕОАВ { 
ту $пате = оиг ФАУТОГОАВ, 
«ФАЏТОГОАЮО = ѕир { рг1пф “Я вижу $пате(@_)\п” }; 
доо &ФАЦТОГОАЮ: # Запустить новую подпрограмму 
} 


Б1агд(30); н выведет: Я вижу та1п: :61агд(30) 
91агЫ(40); # выведет: Я вижу паіп: :91агЬ(40) 
01аг9(50), # выведет Я вижу таіп: :Б1аг9(50) 


Стандартный модуль Аиїо5р1ії применяется разработчиками модулей для авто- 
матического разделения своих модулей на отдельные файлы (имена которых за- 
канчиваются .а1), в каждом из которых содержится одна подпрограмма. Эти фай- 
лы помещаются в каталог аию/ в системной библиотеке Регі, после чего их можно 
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автоматически загружать по требованию с помощью стандартного модуля Аџїо- 
Гоааег. 


Аналогичный подход применяется в модуле 5е11|оадег, за исключением того, что 
он автоматически загружает функции из собственной обласғи ЮАТА файла, что ме- 
нее эффективно в одних отношениях и более эффективно в других. Автозагрузка 
функций Ре! с помощью Аџїоіоайег и Зе1оадег аналогична динамической за- 
грузке скомпилированных функций С посредством модуля БупаЁоадег, за исклю- 
чением того, что минимальная единица автозагрузки — функция, а минималь- 
ная единица динамической загрузки – целый модуль, и при этом обычно компо- 
нуется сразу много функций С или С++. (Заметим, что многие программисты Регі 
прекрасно обходятся без модулей Аџїо5р11ї, Аоџїоіоайег, 5е1-оадег или Пупаіоадег. 
Просто знайте, что такиє модули существуют, на случай, если не сможете пре- 
красно обходиться без них.) 


Можно неплохо развлечься, работая с подпрограммами АЏТОГОАр, служащими 
обертками для других интерфейсов. Давайте, например, потребуем, чтобы для 
каждой неопределенной функции вызывалась команда ѕуѕїеп с теми же аргумен- 
тами. Нужно сделать лишь следующее: 


ѕир АЦТОШОАО { 
ту $ргодгат = оиг ФАУТОЕОАО; 
фргодгат =- $/.*:://; # обрезать имя пакета 
зузтет( $ргодгат, @_); 

} 


(Поздравляем, вы реализовали элементарную форму модуля 51е11, который вхо- 
дит в стандартную поставку Рег!.) Вызвать свой автозагрузчик (в ОС О МХ) мож- 
но так: 


дате(); 

мћо( ‘ат’, `1`); 

1$(°-1'); 

еспо( “Абабидабиварида...”); 
На самом деле, если предварительно объявить функции, которые требуется вы- 
зывать таким способом, можно действовать так, как если бы они были встроен- 
ными, и опускать скобки при вызове: 


зиб дате (;$$); # Допускает от нуля до двух аргументов. 
зир мћо (;$$$$); # Допускает от нуля до четырех аргументов 
5иб 18; # Допускает любое число аргументов 

ѕиб есһо ($@); # Допускает не менее одного аргумента 
дате; 

во “ап”, “1”; 

16 "1"; 


еспо "Тһаї'ѕ а11, Ғо1К»!"; 


Начиная с версии у5.8, АУТОГОАО может иметь атрибут :1\аше. 


раскаде Сһапеаи; 
иѕе \5. 14; 


ѕир пем { 61езз {}, $ [0] } 
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зиб АЦТОГОАО :1уа1ие { 
сиг ЗАЧТОГОАО; 
пу Фтесһод = ФАЦТОЕОАВ =- 3/.*:://г: 
$ [0]->{$пеїтћоа}, 

} 


1, 
Этот метод можно использовать для организации доступа или присваивания ему: 


иѕе у5. 14; 
изе Сһатеаџ; 


ту Фсһатеаџи = Сһатеаџ->пем, 
Фсһатеаи->амақе = `уез’: 


ѕау $спатеаи->амаке; 
Или сделать последнее значение символической ссылкой: 


раскаде тгатре1т1ег: 


ѕир пем { Б1езз {}, $ [0] } 
ѕир АОТОЕОАВ :1уа1ие { по ѕїгісї 'геѓѕ ; *{$АЦТОГОАЮ} } 


15 
чтобы получить возможность определять метод через присваивание: 
иѕе Тгатре1ї1іег; 
ту фігатре11іег = Тгатре1+іег->пем, 
$Тгатре111ег->пате = ѕир { Ате]іа' } 


Однако, мы не уверены, что вы загоритесь желанием поступать так. 


Модули 


В языке Регі модуль является фундаментальной единицей повторного использо- 
вания кода. С точки зрения реализации, модуль — это просто пакет, определен- 
ный в одноименном файле с расширением „рт. В этой главе мы узнаем, как поль- 
зоваться сторонними модулями и создавать собственные. 


В поставку Ре! входят сотни модулей, которые можно найти в каталоге [іб дист- 
рибутива Рец, или в каталоге, выбранном на этапе сборки регі. Получить список 
каталогов с модулями позволяет ключ -У? 


х рег1 -У\ 
Зиттагу о? ту рег15 (ге\у1310п 5 уегѕіоп 14 ѕируегѕіоп 1) сопРідигаћтіоп: 


Виі1т ипаег вагмап 

Сотрі1еа ат Ји1 5 2011 21:43:59 

ІМС: 
/оѕг/Лоса1/рег1/110/51іїе_рег1/5. 14.2/дагизп-21еуе1 
/иѕг/1оса1/рег1/1160/5і+е рег1/5. 14.2 
/иѕг/1оса1/рег1/110/5. 14.2/дагміп-21еуе] 
/иѕг/1оса1/рег1/110/5. 14.2 


Получить полный список модулей, поставляемых вместе с рей, можно с помо- 
щью команды согейз$ф, которая также входит в состав дистрибутива Реп: 


Х соге1ізї -у 5.014 


Кроме того, для всех стандартных модулей существует обширная электронная до- 
кументация, которая (о, ужас!), скорее всего, окажется более актуальной, чем дан- 
ная книга. Попробуйте применить команду регійос для чтения документации: 


х рег1йос 0ідеѕї: : М05 


Архив Рей «Сотргеһепѕіуе Рей Атсһіуе Меімогк» (СРАМ) являет собой всемир- 
ное хранилище модулей, созданных сообществом Рег], и обсуждается в главе 19. 
См. также ћѓїр://илилю.срап.огё. 
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Загрузка модулей 


Модули бывают двух видов: традиционные и объектно-ориентированные. Тради- 
ционные модули определяют подпрограммы и переменные, которые вызываю- 
щая сторона может импортировать и, конечно, использовать. Объектно-ориенти- 
рованные модули действуют как определения классов, и доступ к ним осуществ- 
ляется через вызовы методов, как описывается в главе 12. Некоторые модули со- 
вмещают Эти подходы. 


Модули Ре! обычно включаются в программу командой: 
изе МОБИЕЕ; 
что эквивалентно такой конструкции: 


ВЕСТМ { 
гедиіге МОРЕ; 
МОРШ Е->ітрог?(); 
} 


Загрузка выполняется на этапе компиляции, поэтому весь программный код 
в модулях выполняется в процессе компиляции. Обычно это не является пробле- 
мой, потому что большая часть кода в модулях заключена в подпрограммы и ме- 
тоды. Некоторые модули могут загружать дополнительные модули, Х8-код! и дру- 
гие компоненты. Поскольку директива изе выполняется сразу, как только попа- 
лась на глаза Рец, все изменения в @1№С должны предшествовать директиве ие. 
Возможно, вам требуется прагма 116 (см. главу 29), которая также загружается 
с помощью ие. 


Если возникнет необходимость загрузить модуль на этапе выполнения, напри- 
мер, чтобы отложить его включение до выполнения некоторой подпрограммы, 
нуждающейся в нем, можно воспользоваться функцией гедиіге: 


гедилге МОРЕ; 


Аргумент МОБШЕ должен быть именем пакета, которое будет преобразовано в имя 
файла модуля. Директива изе преобразует символы в и добавляет в конец .рт. 
Она пытается отыскать полученное имя в @1\С. Если предположить, что модуль 
называется Ап1та/::Матта1 ::НопеуВаддег, директива џѕе будет искать файл Апипа/ 
Матта/НопеуВаавегрт. После загрузки модуля путь к соответствующему 
файлу будет добавлен в %Т\№С. Файл загружается только один раз. Перед тем как 
загрузить файл, Рег проверит содержимое %1№С, чтобы убедиться, что файл не 
был загружен ранее. Если выяснится, что файл был загружен, Рег! использует 
загруженную версию. 


Файл можно загрузить напрямую, посредством гедиіге, указав корректный путь 
(который может зависеть от платформы): 


геди1ге АГЕ; 
гедиіге `Апіта1 /Матта1 /НопеуВавдег. рт’: 


Х8-код (еХіегпа1 Зибгои тез — внешние подпрограммы) — это модули, написанные на 
компилируемых языках программирования, обычно С, и пригодные для импортиро- 
вания из программ и модулей на языке Рег. – Прим. перев. 
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В целом, однако, предпочтительнее использовать изе, а не гедизге, потому что 
в этом случае поиск модулей происходит во время компиляции и, если имеются 
ошибки, о них можно будет узнать раньше. 


Некоторые модули предлагают дополнительную функциональность в виде спи- 
ска импорта. Этот список превращается в список аргументов для функции іпрогі: 


иѕе МОРИЕ Е1$Т; 
эквивалентно: 


ВЕСІМ { 

гедиіге МОРЕ; 

МОРИ Е->ітрогї( 2197); 
} 


Метод іпрогі модуля может выполнять любые действия, но в большинстве моду- 
лей он используется для определения номера версии, унаследованного от Ехрогїег, 
о котором мы поговорим ниже. Обычно метод ітрогї добавляет символы (подпро- 
граммы и переменные) в текущее пространство имен, чтобы обеспечить их дос- 
тупность в оставшейся части единицы компиляции. Некоторые модули имеют 
список импорта по умолчанию. 

Например, модуль Наѕћ::+11 экспортирует несколько символов для выполнения 


специальных операций с хешами. Следующая директива џѕе добавит символ 
10ск_кеуѕ, который окажется доступен в оставшейся части единицы компиляции: 


иѕе Наѕћ: :1411 дм(1оск_кеуз); 


1оск_Кеуѕ( ту Жһаѕћ, дм(пате 1осаїіоп) }, 


Даже при вызове без списка / 157 директива и5е может импортировать символы, 
включенные в список импорта по умолчанию. При загрузке модуля Е: 1е::Ваѕепапе 
автоматически импортируются функции раѕепапе, а1гпаме и Ғі1ерагѕе: 


иѕе Рі1е: : Ваѕепате; 


зау Баѕепате($ААСМ[О 1); 


Если ничего не требуется импортировать из модуля, можно явно указать пустой 
список: 


иѕе МОРИЕ (). 


Иногда бывает желательно использовать конкретную версию модуля (или вер- 
сию, не ниже определенной), чтобы избежать известных проблем, имеющихся 
в прежних версиях, или использовать новейший АРІ, не совместимый со стары- 
ми версиями: 


ове МОВИЕЕ УЕЯЗТОМ ЕТТ; 


Обычно вполне подходит версия равная или выше /ЕА510№. Нельзя указать точ- 
ную версию или диапазон версий. Однако модуль может принять иное решение, 
поскольку в действительности \/ЕНЗТОМ — это метод. 


- В наши дни это считается несколько невежливым. Вынуждая программиста явно ука- 


зывать, что он хочет импортировать, вы поможете ему избежать конфликтов между 
двумя разными модулями, экспортирующими одинаковые имена. 
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Выгрузка модулей 


Директива по противоположна директиве изе. Вместо метода іпрогї она вызывает 
ипітрог+. Последний может делать все, что угодно. Синтаксис выгрузки модуля 
точно такой же: 


по МОЕ; 

по МОРЕ Е1Т$Т; 

по МОРИШ Е УЕВЗТОМ; 

по МОРИ Е МЕВЅТОМ ЕТ$Т. 


Иногда бывает желательно, чтобы некоторые символы были доступны лишь не- 
продолжительное время. Например, при загрузке модуля Моозе, объектной систе- 
мы, основанной на встроенных возможностях Ре, импортируется множество 
вспомогательных методов. Метод һаѕ объявляет атрибуты, но как только эти име- 
на станут не нужны, их можно удалить. В конце раздела, где они используются, 
эти имена можно выгрузить директивой по: 


раскаде һегѕоп; 
иѕе Моозе; 


һаѕ "?Рігет_ пате" => (18 => “ги”, 15а => “5#г") 
Раз “1аѕї папе" => (1$ => “гм”, іѕа => “Ѕїг") 


$и6 #011 пате { 
пу $561? = ѕһћіғї; 
фѕе1ғ->Ғігѕт пате “ фѕе1ғ->1а51 пате 


} 


по Мооѕе; # удалит ключи из пакета Регзоп 


Чтобы временно отключить прагму ѕїгісї, ее можно выгрузить, как показано ни- 
же. Используйте этот прием с как можно меньшими областями видимости, чтобы 
не пропустить другие проблемы: 


ту $уа1ие = оо { 
по ѕігісї "геғѕ” 


ф{ "${с1а55}::пате}" } # символическая ссылка 


} 


Аналогично может потребоваться временно отключить вывод некоторых преду- 
преждений, чего можно добиться, выгрузив их: 


иѕе магп1п9$; 
{ 

по магп1пд$ геде?іпе '; 
1оса1 +рафдег = зи6 { }; 


ЧЫ 


Создание модулей 


В этой главе мы просто покажем фрагмент модуля. Все, что касается создания 
дистрибутивов, будет описано в главе 19. 
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Именование модулей 


Выбор хорошего имени для модуля является важным этапом в создании модуля. 
Как только имя будет выбрано и люди начнут использовать ваш модуль, вам при- 
дется жить с этим именем практически вечно, так как пользователи обычно не 
стремятся обновлять свой код. Если вы собираетесь опубликовать свой модуль 
в архиве СРАМ, желательно, чтобы другие легко могли отыскать его. Некоторые 
правила именования модулей можно найти на странице РАОБЕ (В Ир://раизе.рет. 
оге/раизе/диегугАСТТОМ=раизе_патипатоащез). 


Имя модуля должно начинаться заглавной буквой, если только оно не использует- 
ся вкачестве прагмы. Модули прагм (глава 29) действуют подобно директивам ком- 
пилятора (дают советы компилятору), поэтому мы резервируем нижний регистр 
для имен директив (директивных модулей) для использования в дальнейшем. 


Если вы желаете сделать модуль закрытым модулем, имя которого никогда не 
должно конфликтовать с именами модулей в стандартной библиотеке или в СРАМ, 
можно воспользоваться пространством имен і оса1. Это пространство имен не за- 
прещено в архиве СРАМ, но по общепринятому соглашению там не используется. 


Пример модуля 


Выше говорилось, что модули бывают двух видов: традиционные и объектно-ори- 
ентированные. Ниже мы покажем короткие примеры модулей того и другого типа. 


Проще всего продемонстрировать объектно-ориентированные модули, поскольку 
для их взаимодействия с пользователем требуется минимум инфраструктуры. 
Все операции выполняются посредством методов: 


раскаде везтзагу::00 1.001; 


ѕир пем { 
ту( $с1а55, @агоз ) =@_, 
р1еѕѕ {}, $с1аз$; 


ѕир саме? { "Одногорбый верблюд” } 
$46 меідћї { 1024 } 


вин другие методы 


Программа, использующая данный модуль, будет выполнять все операции по- 
средством методов: 


изе у5. 10; 
иѕе Веѕііагу: :00; 


пу $беѕтзагу = Веѕїлагу: :00->пем; # метод класса 


зау “Животное: ”. $6еѕііагу->сате1(), 
“ весит " $реѕіагу->меідһі(), 


Чтобы сконструировать традиционный модуль с именем Веѕїіагу, создайте файл 
Везнагу.рт со следующим содержимым: 
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расКаде Веэагу; 
иѕе рагепї ом(Ехрогтег); 


сиг @ЕХРОВТ = ам(сатеЈ); # Имена, экспортируемые по умолчанию 
оиг @ЕХРОВТ_ОК = ам(Фмеіодһе), # Имена, экспортируемые по запросу 


нин Здесь включаются ваши функции и переменные 
вир сател { ргіпі “Одногорбый верблюд” } 
фмеідһі = 1024; 


1; # модуль завершается выражением, возвращающим истинное значение 


Теперь программа может сказать изе Веьїіагу, чтобы получить доступ к функции 
сапе1 (но не к переменной $иеідћї), и сказать изе Вез{1агу дм(сате1 $меідћї), чтобы 
получить доступ как к функции, так и к переменной: 


изе \5.10, 
изе Веѕїіагу дм(сате]1 $меідһї), 


ѕау "Животное: сате1(), ” весит Фмеідһі” 


Можно также создавать модули, динамически загружающие код, написанный 
на С, однако здесь мы не станем об этом рассказывать. 


Закрытость модуля и Ехрогїег 


Реті не осуществляет автоматическое патрулирование границ между закрытыми 
и открытыми элементами в своих модулях - в отличие от таких языков, как С++, 
Јауа и Ада, Рей не озабочен принудительной безопасностью. Модуль Рег пред- 
почтет, чтобы вы не входили в его комнату, потому чтс вас не приглашали, а не 
потому, что у него есть дробовик. 


Между модулем и его пользователем заключается соглашение, включающее поло- 
жения прецедентного права, а также письменный контракт. Прецедентное право, 
к примеру, устанавливает, что модуль будет воздерживаться от изменения любого 
пространства имен, если его об этом не просили. Письменный контракт для моду- 
ля (т.е. документация) может ставить дополнительные условия. И тогда после про- 
чтения контракта предполагается, что, говоря изе Аедеѓіпе! п/0"10, вы знаете, что 
изменяете мир, и готовы к возможным последствиям. Самый распространенный 
способ переопределения миров — использование модуля Ехрогїег. Как мы увидим 
далее в этой главе, Ехрогїег позволяет переопределять даже встроенные функции. 


Если модуль загружен посредством изе, обычно он делает некоторые переменные 
и функции доступными вашей программе или, точнее, ее текущему пакету. Это 
действие по экспортированию имен модуля (импортированию их в вашу програм- 
му) иногда называют загрязнением (роПийпа8) вашего пространства имен. Боль- 
шинство модулей использует для этого Ехрогїег, поэтому в начале большинства 
модулей есть подобные строки: 


изе рагепі ам(Ехрог{ег); 


геди1ге Ехрогтег; 
сиг @ТЗА = ("Ехрогтег”); 
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Эти две строки заставляют модуль наследовать класс Ехрогїег. Наследование опи- 
сывается в следующей главе, а пока достаточно знать, что наш модуль Веѕїіагу 
может экспортировать имена в другие пакеты с помощью таких строк: 


оиг @ЕХРОВТ = ом(Фсате1 %мо1* гат); # Экспорт по умолчанию 
оиг @ЕХРОВТ_ОК = ом(1еорага @11ата $ети); к Экспорт по запросу 
сиг ЖЕХРОВТ_ТАС$ = ( # Экспорт группы 


сате119$ => [ам($сате1 @11ата) ], 
сгіїтегѕ => [ам(гат $сате1 мо1Ғ) ], 
); 


С точки зрения экспортирующего модуля, массив @ЕХРОВТ содержит имена пере- 
менных и функций, экспортируемых по умолчанию; то, что получит ваша про- 
грамма, сказав изе Веѕїіагу. Переменные и функции в @ЕХРОНТ_ОК экспортируют- 
ся, только когда программа специально запрашивает их посредством ие. Нако- 
нец, пары ключ/значение в %ЕХРОВТ_ТАб$ позволяют программе включать отдель- 
ные группы имен, перечисленные в @ЕХРОВТ и @ЕХРОВТ_ОК. 


С точки зрения импортирующего пакета, директива изе задает список импорти- 
руемых имен, группу, указанную в ХЕХРОВТ ТАб5, шаблон имен или вообще ниче- 
го – в последнем случае в программу импортируются имена, указанные в @ЕХРОВТ. 


Для импорта имен из модуля Веѕїіагу можно включить любую из следующих ин- 
струкций: 


Импортировать имена из @ЕХРОВТ 

Ничего не импортировать 

Импортировать функцию гат и массив @11 ата 
Импортировать $сате] и @1]ата 

Импортировать имена @ЕХРОВТ 

изе Веѕііагу дм(/ат/); Импортировать Фсате1, @11ата и гат 

иѕе Веѕтіагу 9м(/^\$/); Импортировать все скаляры 

изе Веѕїіагу ом(:сгіїїегѕ ! гат); # Импортировать сг1{Тегз, но не гат 

иѕе Веѕїіагу им( :сгії+егѕ !:сате? 19$); # Импортировать сгіїїТегѕ, за исключением сате1105 


иузе Веѕїіагу; 

иѕе Веѕііагу (); 

изе Веѕїіагу ом(гат @11ата); 
изе Веѕ+іагу ом( :сате1145); 
иѕе Веѕ+іагу дм( : ВЕҒАШІТ); 


ЕЕЕ Е-Е 3-3 


Отсутствие элемента в списке экспорта (или явное удаление из списка импорта 
с помощью восклицательного знака) не делает его недоступным программе, ис- 
пользующей модуль. Программа всегда может обратиться к содержимому пакета 
модуля, полностьюквалифицировавегоименем пакета, например, #Вез{1агу: :деско. 
(Поскольку лексические иеременные не принадлежат пакетам, возможность за- 
крытия сохраняется; см. раздел «Закрытыє методы» в следующей главе.) 


Чтобы увидеть, как обрабатываются спецификации и что в действительности им- 
портирует ваш пакет, можно сказать ВЕСІМ { $Ехрогїег::Мегроѕе=1 }. 


Ехрогїег является модулем Регі, и, если вам интересно, вы можете увидеть, какие 
фокусы он выделывает с їіуреғ1оЬ для экспорта имен из одного пакета в другой. 
Ключевой функцией внутри Ехрог{ег служит функция іпрогї, которая назначает 
псевдонимы, делая возможным обращение к имени из одного пакета в другом. 
На практике команда изе Веѕііагу [15Т совершенно эквивалентна следующим 
строкам: 


ВЕСТМ { 
гедиіге Веѕїіагу; 
ітрог Веѕїіагу 115Т, 
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Это значит, что вашим модулям не обязательно обращаться к Ехрогїег. При за- 
грузке модуль может делать все, что угодно, ведь изе просто вызывает для модуля 
обычный метод 1прогт, а вы можете определить этот метод так, чтобы он делал все 
что вам угодно. 


Экспортирование без вызова метода ітрогї модуля Ехрогїег 


Ехрогтег определяет метод с именем ехрогї їо 1еуеі1, применяемый, когда (по ка- 
кой-то причине) нельзя непосредственно вызвать метод ітрогї модуля Ехрогїег. 
Метод ехрогї їо _1еуе1 вызывается так: 


МОБИЕЕ->ехрогт_то_1е\е1 ($ипеге_то_ехрогт, @мпат_то_ехрогт); 


где фиһеге_то_ехрогї – целое число, определяющее, насколько далеко в стек вызо- 
вов должны экспортироваться ваши имена, а бипа{_То_ехро! { ~ массив с экспорти- 
руемыми именами (обычно @_). 


Предположим, например, что в модуле Веѕііагу есть своя функция іпрогї: 


раскаде Веѕїіагу; 
@ТЗА = аи(Ехрогтег); 
@ЕХРОВТ ОК = ом ($200); 


ѕиб 1трогЕ { 
$Веѕїіагу: :200 = "зверинец"; 
} 


Наличие этой функции 1трог{ не позволяет наследовать функцию іпрогі из Ехрогїег. 
Чтобы функция іпрогї из Веѕііагу, после того как она установит $Веѕііагу::700, ве- 
ла себя точно так же, как функция іптрогї из Ехрогїег, ее следует определить так: 


500 зтрогт { 
$Веѕїіагу: :200 = "зверинец"; 
Веѕііагу->ехрогі_+о_1еуе1(1, @ ); 
} 


При этом имена экспортируются на один уровень «выше» текущего пакета, т.е. 
в любую программу или модуль, которые используют Веѕїіагу. 


Однако, если вам требуется лишь это, вероятно, нет смысла наследовать весь мо- 
дуль Ехрогїег. Достаточно импортировать его метод іпрогї: 


раскаде Веѕїіагу; 
иѕе Ехрогфег ам(ітрогт); # у5.8.3 и выше 


Проверка версий 


Если в модуле определена переменная $\УЕЋЅІ0№, программа, использующая этот 
модуль, сможет проверить, достаточно ли свежей является его версия. Например: 


изе Вез{1агу 3.14; н Веѕїтіагу должен иметь версию 3.14 или выше 
изе Веѕііагу %1.0.4: # Вез{1агу должен иметь версию 1.0.4 или выше 


Эти инструкции становятся вызовами метода Вез{1агу->\/ЕВЗТОМ, который наследу- 
ется из модуля ИМТ\УЕВЗАЕ (см. главу 12). 
Директива гедиіге также позволяет проверять версию вызовом метода УЕВЗТОМ: 


гедиіге Вез1агу; 
Вез1агу->\ЕН” О№( ‘`2.71828°); 
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Версии модулей, увы, устроены сложнее, чем хотелось бы, и это неизбежно по ис- 
торическим причинам. Первоначально номера версий назначались без оглядки 
на возможный анализ $\ЕВЗТОМ. Это могло быть число, строка или результат неко- 
торой операции. Долгие годы не существовало стандартного формата строк с но- 
мерами версий, поэтому люди выдумывали самые необычные номера версий, т&- 
кие как “1.23а1рпа"/ Следующие номера версий считаются эквивалентными: 


сиг $УЕВЅІОМ = 1.002003; 
сиг $УЕЋТОМ = `1.002003*: 
сиг $МЕВЗТОМ = \1.2.3; 


иѕе уегз1оп; 
оиг $МЕВУТОМ = уегѕіоп->пем( “”\1.2.3° ); 


Такая схема никому не мешала, пока Рег! не изменил собственную схему нумера- 
ции версий между версиями 5.005 и у5.б. Теперь номером версии стала у-строка, 
специальный литерал, представляющий номер версии и допускающий произ- 
вольное количество точек. Фактически эти о-строки были целыми числами, упа- 
кованными в символы. Затем разработчикам Ре! пришла идея создать объект, 
представляющий версию, и модуль \егз1оп. Если вы вынуждены поддерживать 
по-настоящему древние версии Рег! (сначала выразим наше сочувствие: у5.6 по- 
явилась еще в прошлом тысячелетии), старайтесь придерживаться простых по- 
следовательностей. 


Рег предполагает, что часть после десятичной точки состоит из трех знаков, из-за 
чего результаты сравнения могут показаться странными. Так, версия 1.9 предше- 
ствует версии 1.10, даже при том, что лексикографически .9 сортируется после .1. 
Рет] воспринимает эти числа как 1.009 и 1.010. Должны ли вы с этим соглашаться? 
Нет. Придется ли вам с этим смириться? Да. (Но, как бы то ни было, используйте 
формат \1.9, где это возможно, так как он будет поддерживаться в будущем.) 


И это еще не все. Появилось соглашение для версий, находящихся в разработке. 
Оно предписывает добавлять в номер версии знак подчеркивания (_) или оконча- 
ние ТВІАі. Многие инструменты СРАМ считают такие модули нестабильными. 
Это позволяет авторам выгружать в СРАМ промежуточные версии для опробова- 
ния тестировщиками и предварительные версии для опробования пользователя- 
ми, не вынуждая никого использовать не готовые к выпуску версии (см. главу 19). 


оог $МЕВЗТОМ = `1. 234 001° 


Кавычки необходимы, чтобы сохранить символ подчеркивания в литерале, кото- 
рый в противном случае будет выброшен анализатором, поскольку компилятор 
допускает использование этого символа в числовых литералах. 


Дэвид Голден (Юауіа СоІӣеп) подробнее рассказывает об этом в статье «Мегѕіоп 
питБегѕ =ћоџа Бе Богіпе» (Номера версий должны быть простыми) (#Ёр://шило. 
Ӣавоійеп.сот/іпӣех.рћр/369/оегѕіоп-питфегѕ-ѕзћоша-Бе-Богіпе/). 


Обратите внимание, что в последних версиях Рег! можно избавиться от объявле- 
ния оиг и просто писать: 


раскаде Веѕїіагу 1.2.3; 


1 Чтобы осознать, насколько бредовыми могут быть номера версий, загляните в модуль 


СРАМ: :01зтпате!пРо, реализующий распознавание версий. 
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Действия при обнаружении неизвестных имен 


В некоторых ситуациях может потребоваться воспрепятствовать экспорту не- 
которых имен. Обычно это относится к модулям, содержащим функции или кон- 
станты, не имеющие смысла в некоторых системах. Можно помешать модулю 
Ехрогїег экспортировать эти имена, поместив их в массив @ЕХРОВТ РАІ. 


Когда программа попытается импортировать одно из этих имен, Ехрогѓег даст мо- 
дулю возможность обработать ситуацию, прежде чем сгенерировать ошибку. При 
этом он передаст список ошибочных имен методу ехрогі ѓаі1, который можно 
определить так (в предположении, что ваш модуль использует модуль Сагр): 


изе Сагр; 

ѕир ехрогт_Ғаі1 { 
ту $С1аз$ = $ћіҒЁ; 
сагр “К сожалению, эти имена недоступны: @_; 
геїигп @_; 


} 


Ехрогїег предоставляет вызываемый по умолчанию метод ехрогї_ѓаі1, который про- 
сто возвращает список в неизменном виде и прерывает вызов из6, возбуждая ис- 
ключительную ситуацию для каждого имени. Если ехрогї Ѓаі1 возвращает пустой 
список, значит, ошибки отсутствуют, и все запрошенные имена экспортируются. 


Вспомогательные функции для обработки групп имен 


Поскольку имена, перечисленные в ЖЕХРОНТ 1А65, должны также присутствовать 
в бЕХРОНТ или @ЕХРОВТ_ОК, в Ехрогїег есть две функции, позволяющие добавить эти 
помеченные группы имен: 


ФЕХРОВТ_ТАС$ = (Ғоо => [ам(аа 00 сс)], Баг => [дм(аа сс 9а) ]) 


Ехрогїег : :ехрогі_+адѕ( "оо" ); # добавить аг, бр и сс в @ЕХРОНТ 
Ехрогтег: :ехрогі_ок_ћадѕ("Ббаг"); # добавить аа, сс и 99 в @ЕХРОВТ ОК 


Попытка передать имя, не являющееся идентификатором группы имен, вызовет 
ошибку. 


Замещение встроенных функций 


Многие встроенные функции могут быть замещены (ооеггіййеп), однако делать 
это стоит лишь в редких случаях, имея достаточные на то основания. Обычно за- 
мена может осуществляться в пакете, пытающемся эмулировать отсутствующие 
встроенные функции в системе, отличной от ОМХ. (Не путайте замещение (оуег- 
гідіпе) с перегрузкой (ооегіоайіп&), которая придает встроенным операторам до- 
полнительные объектно-ориентированные значения, но ничего не замещает. До- 
полнительно читайте об этом в описании модуля охег1оай в главе 18.) 


Замещение может осуществляться только путем импортирования имени из мо- 
дуля – обычного предварительного объявления для этого недостаточно. Если го- 
ворить совсем откровенно, замещение — это сохранение ссылки на код в записи 
їуреғ1оЬ, как в выражении *ореп = \8птуореп. Кроме того, такое присваивание 
должно осуществляться в другом пакете; это сделано с целью затруднить случай- 
ное замещение при создании псевдонима ъуре21ю5. Если вам действительно нужно 
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выполнить собственное замещение, не отчаивайтесь, потому что директива 365$ 
позволяет заранее, посредством импортирующего синтаксиса, объявить имена 
подпрограмм, которые впоследствии заместят встроенные: 


иѕе ѕирѕ ам(сһаіг сһгоої сһтоа сһомп); 
сһдіг $50шемһеге; 
ѕир сћааг { ... } 


Вообще говоря, модулям не следует экспортировать такие встроенные имена, как 
ореп или СПа1г, в составе списка по умолчанию (@ЕХРОНТ), поскольку они могут по- 
пасть в другое пространство имен и неожиданным образом изменить семантику. 
Если вместо этого включить такое имя в список @ЕХРОВТ_ОК, импортерам придется 
запрашивать замещение встроенного имени явным образом, и все останутся че- 
стными друг перед другом. 


Исходные версии встроенных функций всегда доступны через псевдопакет СОВЕ. 
Поэтому СОВЕ: :сһдіг всегда вызовет версию, изначально встроенную в Регі, даже 
если заместить ключевое слово спо1г. 


Ну, почти всегда. Описанный механизм замещения умышленно ограничен тем па- 
кетом, который запрашивает импорт. Но есть механизм є более широким спек- 
тром действия, позволяющий заместить встроенную функцию везде, игнорируя 
границы пространств имен. Это достигается путем определения функции в псев- 
допакете СОВЕ: :С.0ВАІ. В следующем примере оператор 0100 заменяется на нечто, 
что понимает регулярные выражения. (Учтите, что этот пример реализует не все, 
что нужно для чистого замещения встроенного оператора 0100, который ведет себя 
по-разному в скалярном и списочном контекстах. На практике многие встроенные 
функции Рей имеют такие зависящие от контекста режимы, и каждое правильно 
написанное замещение должно их адекватным образом поддерживать. Полно- 
функциональный пример замещения 9106 можно найти в модуле Ее::6105, по- 
ставляемом с Рег.) Тем не менее, вот асоциальная версия: 


«СОВЕ: : СОВА! : :9106 = ѕир { 
ту Фрат = ѕһіҒЕ; 
пу @дої, 
1оса1 *0; 
1Ғ (орепаіг 0, ”.”) 4 
@90{ = дгер /$ра+/. геадаіг 0; 
с1оѕедіг 0; 
} 
гефигп @90ї; 
} 


раскаде ипатеуег; 


ргіпі <[а-2_]+\.рт\$>; # показать все директивы в текущем каталоге 


При глобальном замещении 9106 происходит вытесняющее навязывание нового 
(и подрывного) режима действия оператора 0100 в каждом пространстве имен без 
уведомления или согласия модулей, являющихся владельцами этих пространств 
имен. Конечно, это нужно делать с крайней осторожностью - если делать вообще. 
Скорее всего, так делать не стоит. 


Наша философия замещения такова: приятно быть важным, но важнее быть при- 
ятным. 


12 


Объекты 


Прежде всего, вам потребуется понимание пакетов и модулей; см. главу 10 и гла- 
ву 11. Помимо этого — понимание ссылок и структур данных; см. главу 8 и гла- 
ву 9. Не лишним будут некоторые познания в объектно-ориентированном про- 
граммировании (ООП), поэтому в следующем разделе мы прочтем вам небольшой 
курс ООЖ (объектно-ориентированного жаргона). 


Объектно-ориентированная модель Регі, вероятно, существенно отличается от 
моделей ООП, с которыми вы работали в других языках. Читая эту главу, лучше 
забыть все, что вы знаете из этих других языков. 


Краткая памятка 
по объектно-ориентированному жаргону 


Объект - это структура данных с некоторым набором поведенческих характери- 
стик (Беһауіогѕ). Обычно мы говорим о поведении объекта, как если бы оно осу- 
ществлялось им непосредственно, иногда доходя до антропоморфизма. Напри- 
мер, можно услышать, что прямоугольник «умеет» выводить себя на экран или 
что он «знает», как вычислить свою площадь. 


Каждый объект обладает своим поведением благодаря тому, что является экзем- 
пляром (іпзіапсе) класса. Класс определяет методы: элементы поведения, дейст- 
вующие для класса и его экземпляров. Когда это существенно, мы называем ме- 
тоды, применимые только для конкретного объект&, методами объекта или ме- 
тодами экземпляра, & методы, применимые для класса в целом, методами клас- 
са. Так принято говорить, однако для Рег метод – всегда только метод, и Ре] 
различает методы лишь по типам первого аргумента. 


Метод экземпляра можно рассматривать как некоторое действие, осуществляемое 
конкретным объектом, например вывод самого себя, копирование себя или изме- 
нение одного или нескольких своих свойств («установить название этого меча рав- 
ным Андурил»). Методы класса могут осуществлять операции над совокупностью 
многих объектов («вывести названия всех мечей») или выполнять другие действия, 
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не зависящие от конкретных объектов («с данного момента, когда выковывается 
новый меч, регистрировать его владельца в этой базе данных»). Методы, создаю- 
щие экземпляры (объекты) класса, называются конструкторами («создать меч 
с рукояткой, украшенной драгоценными камнями и таинственной надписью»). 
Обычно это методы класса («сделать мне новый меч»), но могут быть и методы объ- 
екта («сделать точную копию этого меча»). 


Класс может наследовать (іпћегії) методы родительских классов (рагепі сіаѕѕезѕ), 
называемых также базовыми классами (Баѕе сіазѕеѕ) или надклассами (ѕирег 
сІазѕеѕ). В этом случае класс называется производным классом (егіџей сіаѕѕ) или 
подклассом (ѕиБсіазѕѕ). (Еще более запутывает то обстоятельство, что под «базовым 
классом» в литературе иногда имеется в виду «самый верхний» надкласс. Мы 
в таком значении его не используем.) Наследование придает новому классу эле- 
менты поведения существующего класса, но позволяет изменять или добавлять 
новые элементы поведения, отсутствующие у его родителей. При вызове метода, 
определения которого нет в классе, Рег] автоматически ищет определение в роди- 
тельских классах. Например, класс меча может наследовать свой метод аіїаск от 
общего класса клинка. У родителей могут быть свои родители, и при необходимо- 
сти Рег| выполнит поиск в классах более далеких предков. Класс клинка, в свою 
очередь, может наследовать метод а{таск от еще более общего класса оружия. 


Когда вызывается метод а аск объекта, итоговое поведение может зависеть от 
того, является ли объект мечом или стрелой. Возможно, никакого различия вооб- 
ще не будет, например, если и меч, и стрела унаследовали свой метод нанесения 
ущерба от более общего класса «оружие». Но если различие в поведении есть, ме- 
ханизм диспетчеризации методов выберет метод а{Таск, подходящий для рас- 
сматриваемого объекта. Полезное свойство, позволяющее всегда выбрать наибо- 
лее подходящее поведение для конкретного типа объекта, называется полимор 
физмом. Это важный вид безразличия. 


При реализации класса необходимо заботиться о внутреннем содержании своих 
объектов, но при использовании класса его объекты следует считать черными 
ящиками. Невозможно увидеть, что находится внутри, не требуется знать, как он 
работает, – вы взаимодействуете с ящиком лишь на его условиях: через методы, 
предоставляемые классом. Даже если известно, что конкретно эти методы делают 
с объектом, следует сопротивляться желанию покопаться в объекте напрямую. 
Это как пульт управления телевизором: дажє если вы знаете. что происходит 
внутри него, не следует копаться в его внутренностях из праздного любопытства. 


Рег позволяет заглянуть внутрь объекта из-за пределов класса. Но при этом на- 
рушается принцип инкапсуляции, согласно которому любой доступ к объекту 
должен осуществляться только через его методы. Инкапсуляция отделяет опуб- 
ликованный интерфейс (описывающий, как объект должен использоваться) от 
реализации (определяющей, как он в действительности работает). В Рей отсутст- 
вуют явные ограничения помимо этого неписаного контракта между разработчи- 
ком и пользователем. Ожидается, что обе стороны проявят здравый смысл и бу- 
дут соблюдать приличия: пользователь полагается на документированный ин- 
терфейс, разработчик обещает его не изменять. 


Реп не требует, чтобы вы придерживались определенного стиля программирова- 
ния, и не одержим идеей закрытости, как некоторые другие объектно-ориентиро- 
ванные языки программирования. Однако Рег! одержим идеей свободы, и одна из 
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свобод, которые Ре! предоставляет программисту, это право избрать такую меру 
закрытости, какую он пожелает. На практике Ре] способен обеспечить более 
сильную закрытость классов и объектов, чем С++. Это означает, что Ре! ни в чем 
не ограничивает программиста и, в частности, не ограничивает его право ограни- 
чивать самого себя (если вас привлекают такого рода вещи). В разделах «Закры- 
тые методы» и «Использование замыканий в закрытых объектах», далее в этой 
главе, рассказывается, как можно ужесточить самодисциплину. 


Конечно, это далеко не все, что можно рассказать по теме объектов или подходов 
к объектно-ориентированному программированию. Но это не входит в наши за- 
дачи. Поэтому продолжим. 


Система объектов Рен 


Рен не имеет специального синтаксиса определения объектов, классов или мето- 
дов. Для реализации этих трех понятий применяются существующие конструк- 
ции! Вот несколько простых определений, которые могут показаться вам обод- 
ряющими: 


Обзект является просто ссылкой... э-э, объектом ссылки. 


Поскольку ссылки позволяют отдельным скалярам представлять сложные со- 
вокупности данных, не должно вызывать удивления, что для представления 
объектов используются ссылки. Технически сам объект не является ссыл- 
кой - это то, на что указывает ссылка. Однако программисты на Регі часто не 
вникают в эту тонкость, и, поскольку мы считаем это прекрасной метонимией, 
то продолжим использовать ее, когда нам это будет удобно.? 


Класс является просто пакетом. 


Пакет служит классом благодаря использованию его подпрограмм для выпол- 
нения методов класса и использованию переменных пакета для хранения гло- 
бальных данных класса. Часто один или несколько классов хранят в модуле 


Метод является просто подпрограммой. 


Вы просто объявляете подпрограммы в пакете, используемом в качестве клас- 
са, и они будут использоваться в качестве методов класса. Вызов метода – но- 
вый способ обращения к подпрограммам — передает дополнительный аргу- 
мент: объект или пакет, используемый для вызова метода. 


Вызов методов 


Если бы потребовалось выделить квинтэссенцию объектно-ориентированного 
программирования, ею стало бы понятие абстракции – единая тема, связываю- 
щая все эти сложные слова, которыми энтузиасты ООП любят перебрасываться, 
такие как полиморфизм, наследование и инкапсуляция. Мы верим в эти причуд- 
ливые слова, но будем рассматривать их с практической позиции: что они означа- 
ют для вызова методов? Методы формируют ядро системы объектов, поскольку 


1 А вот это классный пример повторного использования кода! 


2 Мы предпочитаем лингвистическую живость математической строгости. Можете не 


соглашаться. 
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представляют уровень абстракции, необходимый для реализации всех этих при- 
чудливых терминов. Вместо непосредственного обращения к данным в объекте 
вызывают метод экземпляра. Вместо непосредственного обращения к подпрограм- 
ме в каком-то пакете вызывают метод класса. Располагая этот уровень косвенно- 
сти между использованием класса и реализацией класса, разработчик програм- 
мы получает возможность свободно изменять внутреннее устройство класса, не 
особо рискуя нарушить работу программ, которые его используют. 


Рей поддерживает две синтаксические формы вызова методов. В одной использу- 
ется уже знакомый вам стиль Рег], а вторую вы могли встречать в других языках 
программирования. Какая бы форма вызова метода ни использовалась, подпро- 
грамме-методу всегда передается дополнительный начальный аргумент. Если 
для вызова метода используется класс, этот аргумент будет именем класса. А ес- 
ли объект, этот аргумент будет ссылкой на объект. Чем бы он ни был, мы будем 
называть его инвокантом (іпоосапі)! метода. Для метода класса инвокантом слу- 
жит имя пакета. Для метода экземпляра – ссылка на объект. 


Иными словами, инвокант - это то, с чем вызывается метод. Иногда в литературе 
по ООП его называют агентом (авепі) или актором (асіог). Грамматически инво- 
кант не является ни субъектом действия, ни получателем этого действия. Он более 
похож на косвенное дополнение, бенефициара, от имени и по поручению которого 
осуществляется действие, – как слово «мне» в команде «выкуй мне меч!». Семанти- 
чески можно считать инвокант либо тем, что создает вызов, либо тем, что служит 
предметом вызова, — в зависимости от того, что больше подходит вашему складу 
ума. Мы не собираемся учить вас, как следует думать. (Во всяком случае, об этом.) 


Обычно методы вызываются явно, но могут вызываться и неявно, деструкторами 
объектов, перегруженными операторами или связанными переменными. Строго 
говоря, это не обычные вызовы подпрограмм, а вызовы методов, автоматически 
выполняемые от имени объекта. Деструкторы описываются далее в этой главе, 
перегрузка - в главе 18, а связанные переменные - в главе 14. 


Одно из отличий методов от подпрограмм состоит в моменте времени, когда вы- 
полняется поиск их пакетов, т.е. насколько рано (или поздно) Рей решает, какой 
код должен быть выполнен в результате вызова метода или подпрограммы. Поиск 
пакета подпрограммы производится во время компиляции, прежде чем програм- 
ма начнет выполняться. Напротив, поиск пакета метода не производится до мо- 
мента фактического вызова метода. (Проверка прототипов происходит на этапе 
компиляции, поэтому обычные подпрограммы могут использовать прототипы, 
а методы - нет.) 


Причина, почему пакет метода нельзя определить раньше, относительно проста: 
пакет определяется классом инвоканта, а инвокант неизвестен, пока метод не бу- 
дет вызван фактически. В основе ООП лежит простая логическая цепочка: когда 
известен инвокант, известен класс инвоканта, а когда известен класс, известна 


1 Отлат. іп – в, внутрь и уосаге - звать, призывать. – Прим. ред. 


2 Точнее говоря, вызов подпрограммы разрешается в некоторый іурер1об, ссылка на ко- 
торый компилируется в дерево кодов операций. О значении этого $уреё10Ъ можно дого- 
вориться даже на этапе исполнения — именно это позволяет АТО 0А0 автоматически за- 
гружать подпрограммы. Обычно же и значение этого фуреё]оЪ разрешается на этапе 
компиляции с помощью определения подпрограммы с надлежащим именем. 
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его цепочка наследования, а когда известна цепочка наследования, известна фак- 
тическая подпрограмма, которую нужно вызвать. 


За использование алгоритмов абстракции приходится платить. Из-за позднего 
поиска методов объектно-ориентированное решение в Рец, скорее всего, будет ра- 
ботать медленнее, чем соответствующее решение без применения ООП. Для неко- 
торых изощренных приемов, описываемых ниже, замедление может быть значи 
тельным. Однако многие распространенные задачи решаются написанием кода 
не быстрого, но умного. Вот тут и начинает блистать ООП. 


Вызов методов с помощью оператора стрелки 
Как уже упоминалось, есть два стиля вызова методов. Первый выглядит так: 


ІМУОСАМТ->МЕТНОР( 1 ІТ) 
ТМУОСАМТ->МЕТНОВ 


По очевидной причине этот стиль обычно называют стрелочной формой вызова. 
(Не путайте -> и =>, «двуствольную» стрелку, используемую вместо запятой.) Если 
есть аргументы, необходимы круглые скобки. При выполнении вызова Рег] сна- 
чала отыскивает подпрограмму, определяемую совокупностью класса инвоканта 
ТМУОСАМТ и имени метода МЕТНОР, а затем вызывает ее, передавая ТМУОСАМТ в качестве 
первого аргумента. 


Если ТМУОСАМТ является ссылкой, мы говорим, что МЕТНОР вызывается как метод 
экземпляра (объекта), а если ТМ/ОСАМТ является именем пакета, говорим, что МЕТНОО 
вызывается как метод класса. На практике различий между тем и другим нет, за 
исключением того, что имя пакета более очевидным образом связано с самим 
классом, чем с объектами этого класса. Поверьте нам на слово, объекты тоже зна- 
ют, к какому классу они принадлежат. Очень скоро мы расскажем, как связать 
объект с именем класса, но использовать объекты можно и без этой информации. 


Например, чтобы создать объект с помощью метода класса ѕиппоп и затем вызвать 
метод экземпляра ѕреак с полученным объектом, можно сказать: 


фтаде = Міғага->ѕиттоп("бапдг1#”); # метод класса 
Фтаде->ѕреак("#гіепа") # метод экземпляра 


Методы зиттоп и зреак определены классом \1гага (Волшебник) – или одним из 
классов, которые он наследует. Но вас это не должно беспокоить. Не вмешивай- 
тесь в дела Волшебников. 


Поскольку оператор стрелки левоассоциативен (см. главу 3), две инструкции 
можно даже объединить в одну: 
М хага->ѕзиттоп( "бапда1#" )- >ѕреак("Ғгіепа” ); 


Иногда требуется вызвать метод, не зная заранее его имени. Можно выбрать стре- 
лочную форму вызова метода и заменить имя метода простой скалярной пере- 
менной: 


$пеїһоа = "ѕиптоп”; 
$таде = Міғага->Фтеїһоа( "бапада1#"): # Вызвать Мігага->ѕиттоп 


фтгауе1 = $сотрап1оп ед “ЗпадомРах ? “г1де” ма1к”; 
фтаде->%1гаме1("ѕеуеп 1еадџеѕ”); # Вызвать фпаде->гійе или $паде->ма1к 
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Хотя имя метода служит для его косвенного вызова, такое использование не за- 
прещается в области действия прагмы изе ѕігісї `геѓѕ’, поскольку в действитель- 
ности для всех обращений к методам их поиск осуществляется по таблицам имен 
в момент разрешения. 


В нашем примере мы сохранили в $1гауе1 имя метода, но это могла быть и ссылка 
на подпрограмму. В этом случае минуется алгоритм поиска метода, но иногда это 
как раз то, что требуется. Посмотрите раздел «Закрытые методы» и обсуждение 
метода сап в разделе «ОМТУЕВЗАТ: первичный класс предков». О том, как создать 
ссылку на конкретный метод конкретного экземпляра, читайте в разделе «Замы- 
кания» главы 8. 


Вызов методов с использованием косвенных объектов 
Второй стиль вызова методов выглядит так: 


МЕТНОР ТММОСАМТ (1 15Т) 
МЕТНОР ТММОСАМТ 115Т 
МЕТНОЮ ТМУОСАМТ 


Круглые скобки вокруг {157 не обязательны; если их опустить, метод действует 
как списочный оператор. Поэтому можно создавать такие инструкции, как пока- 
зано ниже, с использованием данного стиля вызова методов. Обратите внимание 
на отсутствие точки после имени класса или экземпляра: 


по Реатиге “$матси”; я включить более снисходительный режим (см. ниже) 
$таде = ѕиттоп Міғага "бапда1 +“; 

$петез1з = зиттоп Ва1год Поше => “Могла”, меароп => “мар”; 

тоуе $петеѕіѕ “Бгідде”; 

ѕреак $таде “Ты не пройдешь“; 

бгеак $5+Тағғ; # надежнее использовать: бгеак $ѕїаї? (); 


Синтаксис списочного оператора должен быть вам знаком; это тот же стиль, кото- 
рый используется для передачи дескрипторов файлов в ргіпі и ргілїё: 


ргіпі ЭТОЕВА "һе1р! ! 1\1"; 


Это аналогично таким английским предложениям, как «Сіуе СоПаш іће Рге- 
сіоиввв»!, поэтому мы называем это формой косвенного объекта (іпіігесі објес?). 
Ожидается, что инвокант находится в позиции косвенного объекта (іпаігесі објесї 
8101). Когда вы читаете, что встроенной функции, например ѕузїеп или ехес, что- 
то передается в ее «позицию косвенного объекта», это означает, что передается 
этот дополнительный аргумент без запятых в той же позиции, что при вызове ме- 
тода с использованием синтаксиса косвенного объекта. 


Форма косвенного объекта даже допускает использовать в качестве ПЧУОСАМТ 
конструкцию В10СК, вычисляемую в значение-объект (ссылку) или в значение- 
класс (пакет). Это позволнет так объединить два приведенных вызова в одной ин- 
струкции: 


ѕреак { зиттоп Міғага "бапда1Р” } “Ғгіепа“; 


1 Тот, кто произносит эту фразу (а именно СоПит), говорит о себе в третьем лице. — Прим. 
ред. 
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Синтаксическая путаница с косвенными объектами 


Один синтаксис часто оказывается более удобочитаемым, чем другой. Синтаксис 
косвенного объекта проще, но страдает некоторыми формами синтаксической не- 
однозначности. Во-первых, / 157 в форме вызова косвенного объекта обрабатыва- 
ется синтаксическим анализатором так же, как любой другой списочный опера- 
тор. Поэтому считается, что в выражении 


епсһап Фемога ($%рірѕ + 2) * $соѕї; 


скобки содержат все аргументы независимо от того, что следует за ними. В ре- 
зультате это эквивалентно следующему выражению: 


($змога->епспапт($р1р$ + 2)) * $соѕї; 


Маловероятно, что такое выражение даст нужный нам результат: епсһапі вызы- 
вается только с $рірѕ + 2, а значение, возвращаемое методом, умножается затем 
на $с0$1. Как и с другими списочными операторами, также следует проявлять ос- 
торожность в отношении старшинства && и || относительно апд и ог. 


Например, вызов: 
папе $$мога $019пате || “61атдг1п9”; # здесь нельзя использовать “ог”! 
интерпретируется как подразумевавшееся: 
$=мога->пате($оїапате || “б1амдг1то“); 
но: 
зреак $паде "Ғгіепа" && епїег(); # здесь должен быть "апа"! 
становится двусмысленным: 
$таде->ѕреак(" Ғгіепа" && епїег()); 
Это можно исправить, переписав код в одной из следующих эквивалентных форм: 


епіег() іғ Фтаде->ѕреак("Ғгіепа"); 
фтаде->ѕреак("Ғгіепд`) && епїег(); 
зреак $таде "Ёгіепа” апа еп+ег(); 


Вторая синтаксическая проблема формы косвенного объекта состоит в том, что 
в ней ТМ/ОСАКТ может быть только именем, скалярной переменной без индексғ или 
блоком. Как только анализатор встречает один из этих вариантов, то считает егс 
за ТМУОСАМТ, а потому начинает поиск списка / 157. Значит, вызовы: 


поме Ффрагфу->{1ЕАБЕВ}: # вероятно, ошибочно! 
поме $гідег=[$1 1; # вероятно, ошибочно! 


в действительности интерпретируются как: 


фрагЕу->тоуе->{1ЕАШЕВ}; 
фгідегѕ->тоуе([$11); 


хотя, на самом деле, вероятно, требовалось: 


' Внимательные читатели вспомнят, что это в точности тот список синтаксических эле- 
ментов, которые допускаются после разыменовывающего символа при разыменовании 
переменных, например багу, 6$агуге? или @{$агуге*}. 
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$рагту-> {1ЕАВЕВ} ->тюуе; 
$г1дегз[ $1 ]->томе; 


Анализатор заглядывает вперед липть немного, чтобы найти инвокант для кос- 
венного объекта, т.е. даже не так далеко, как при поиске для унарного оператора. 
В первом варианте таких странностей не возникает, поэтому вы, возможно, пред- 
почтете оператор-стрелу в качестве оружия. 


Дажеванглийском языкеесть аналогичная проблема. Возьмите команду: «Тһгоу 
усиг саё ои {Ве уіпдоу а оу тоизе фо рау мт». Если поторопиться с разбором 
этого предложения, в окно полетит кошка, а не мышка (если только вы не замети- 
те, что кошка уже за окном).1 Подобно Рей, английский язык предлагает два ва- 
рианта синтаксиса для обозначения агента: «ТЬго\/ уойг саї {Ве тоизе» и «Тһгоу 
{Ве тоцзе фо уоцг саі». Иногда более длинная форма оказывается понятнее и про- 
ще, а иногда — более короткая. В Регі, пс крайней мере, вы обязаны заключить 
сложный косвенный объект в фигурные скобки. 


Классы, цитирующие имя пакета 


Последняя синтаксическая двусмысленность вызова методов в стиле косвенных 
объектов состоит в том, что они вообще могут быть опознаны не как обращение 
к методу, если в текущем пакете есть подпрограмма с таким же именем, как у ме- 
тода. В случае вызова метода класса, имя пакета которого совпадает с именем ин- 
воканта, избавиться от этой неопределенности при сохранении синтаксиса кос- 
венного объекта можно, добавив два двоеточия к имени класса, цитируя (расКазе- 
ацо%е), тем самым, имя пакета: 


$06] = мефпод С14А$$:: # принудительно интерпретируется как “СІА55" ->теїћод 
Это важно, потому что обычная запись: 
$007 = пем С1А$$; # может быть воспринято не как вызов метода 


не всегда ведет себя как нужно, если в текущем пакете есть подпрограмма с име- 
нем пем или С1 А55. Даже если старательно использовать для вызова метода стрел- 
ку, а не косвенный объект, в редких случаях все же могут возникать проблемы. 
Ценой помех, вызываемых лишними знаками пунктуации, обозначение (1455: 

гарантирует правильный анализ вызова метода. Первые два примера из приве- 
денных ниже не всегда анализируются одинаково, в отличие от следующих двух: 


$06] = пем Е1мепН1пд; # может быть воспринято как пем( `Е1уепВіпд”) 
# или даже пем(Е1уепВіпо()) 

фору = Е]мепапд->пем; # может быть воспринято как Е1\епВ1п9()->пем() 

$06] = пем Е1уепВіпд: :; # всегда "Е1уепАіпд”->пем() 

форј = Е1мепВіпо: :->пем; # всегда "Е1мепАіпо”->пем() 


Эту нотацию можно сделать симпатичнее посредством творческого выравнивания: 


На русском языке команда могла бы выглядеть так: «Бросьте кошке за окном игру- 
шечную мышку, пусть позабавится». Естественно, в основном тексте речь идет об ори- 
гинале. Читая перевод команды, можно только сделать вид, что не очень понятно, кто 
же будет забавляться. — Прим. ред. 
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$06] = пем Е1уепВіпд: : 


папе => “Магуа”, 
омпег => “бапда1#". 
дотаіп => “Ғіге"“, 
ѕтопе => гғџбу"; 


Все еще можно сказать: «Фу!», глядя на это удвоенное двоеточие, поэтому сооб- 
щим, что всегда можно обойтись простым именем класса, если соблюдаются два 
условия. Во-первых, если в классе нет подпрограммы с именем, совпадающим 
с именем класса. (Если следовать соглашению, требующему, чтобы имена подпро- 
грамм, как пем, начинались символами нижнего регистра, а имена классов, как 
Е1уепћіпд, – символами верхнего регистра, проблема исчезнет.) Во-вторых, если 
класс загружен одной из следующих инструкций: 


иѕе Е1уепАіпо; 
гециіге Е1мепВіпд; 


Наличие любого из этих объявлений гарантирует, что Е1уепВіпо будет интерпре- 
тироваться как имя модуля, а любое голое имя вроде пеи перед именем класса 
Е1уепВіпд – как вызов метода, даже если в текущем пакете будет определена под- 
программа пем. Обычно проблем с косвенными объектами не возникает, если не 
пытаться втиснуть много классов в один файл, из-за чего Ре может не понять, 
что некоторое имя пакета должно восприниматься как имя класса. Тех, кто дает 
своим подпрограммам имена типа Мойи1ећапеѕ, тоже поджидают неприятности. 


Именно это (почти) произошло с нами в примере, где мы сказали: 
по Геатиге “зматсй”; 


Если предположить, что была использована рекомендованная директива 05е 
%5.14 или аналогичная, с версией \5.10 или выше, в языке появится новое ключе- 
вое слово бгеак, используемое в конструкции діуеп. Мы отключили особенность 
"ѕміїсћ", потому что иначе компилятор будет считать имя бгеак ключевым словом. 
Добавление круглых скобок в конце не решает проблему. даже при том, что обыч- 
но это действенное решение (или должно быть таковым), обеспечивающее одно- 
значную интерпретацию такого синтаксиса вызова метода. Компилятор оказы- 
вается в растерянности, не зная, что с этим делать, и это мешает ему продолжить 
свою работу. 


Создание объектов 


Все объекты являются ссылками, но не все ссылки являются объектами. Ссылка 
не может действовать как объект, пока объект ссылки не будет помечен особой мет- 
кой, сообщающей, к какому пакету он принадлежит. Маркировка объекта ссылки 
именем пакета, и, следовательно, именем класса, так как класс — это просто пакет, 
заключается в применении к ссылке функции 0]е5$ и называется Цеззте («благо- 
словение»). Можете считать, что в результате ссылка превращается в объект, хо- 
тя точнее было бы сказать, что ссылка превращается в ссылку на объект. 


Функция 1ез$ принимает один или два аргумента. Первый аргумент является 
ссылкой, а второй — пакетом, которым помечается объект ссылки. Если второй 
аргумент опущен, используется текущий пакет. 
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$063 = { }; # Получить ссылку на анонимный хеш. 
Ь1ез3($061), # Сделать хеш объектом текущего пакета. 
р1еѕ5($00ј, “Сгії+ег”); # Сделать хеш объектом класса Сгіїїег 


Здесь мы использовали ссылку на анонимный хеш, который обычно использует- 
ся как структура данных для объектов. Хеши являются очень гибкой конструк- 
цией. Но хотелось бы подчеркнуть, что функцию 01е55 можно применить к ссыл- 
ке, указывающей на любой элемент, на который вообще можно ссылаться, в том 
числе скаляры, массивы, подпрограммы и їурер1оЬ. Функцию 01655 можно при- 
менить даже к хешу таблицы имен пакета, если найдется уважительная причи- 
на. (И даже если не найдется.) Объектная ориентированность в Ре! совершенно 
ортогональна структуре данных. 


После того как объект ссылки будет помечен, встроенная функция ге! для такой 
ссылки будет возвращать не встроенный тип, а имя класса, например НАЗН. Чтобы 
получить встроенный тип, используйте функцию ге Туре из модуля аїіїгіриїеѕ. 
См. описание аіїгібџиѓеѕ в главе 29. 


Вот так и создается объект. Берется ссылка, вызовом функции 01655 помечается 
именем пакета, и все. Этого достаточно, чтобы создать минимальный класс. Если 
вы лишь пользуетесь классом, то нужно еще меньше, потому что разработчик 
класса спрячет вызов 01655 в методе-конструкторе, который создает и возвраща- 
ет экземпляры класса. Поскольку 01655 возвращает свой первый аргумент, обыч- 
ный конструктор может быть очень прост: 


раскаде Сгіїїег; 
ѕир зрамп { 61езз {}; } 


Или, если расписать подробнее: 


раскаде Сгіїтег; 


ѕир зрамп { 
ту фѕе1ғ = {} # Ссылка на пустой анонимный хеш 
Ь1ез$ $861Ғ, "Сг1їтег`; # Сделать этот хеш объектом Сгллтег 
гетигп $5е1#: Е Вернуть топько что созданный объект Сгіїїег 


} 
Имея такое определение, объект Сгіїїег можно создать вызовом: 


фре = Сгіїтег->ѕрамп, 


Наследуемые конструкторы 


Как и все методы, конструктор – это просто подпрограмма, но мы не вызываем 
его как подпрограмму. Мы всегда вызываем его как метод — метод класса, в дан- 
ном случае, потому что инвокантом является имя пакета. Вызовы методов имеют 
два отличия от вызовов обычных подпрограмм. Во-первых, они получают допол- 
нительный аргумент, о чем говорилось выше. Во-вторых, они подчиняются на- 
следованию, позволяющему одному классу использовать методы другого. 


Механику наследования мы обсудим более строго в следующем разделе, а пока 
приведем несколько простых примеров, которые помогут вам в создании собст- 
венных конструкторов. Допустим, что есть класс 5рійег (паук), наследующий ме- 
тоды класса Сгіїтег (живое существо). В частности, предположим, что в классе 
Ѕрідег нет собственного метода зрамп. Тогда при вызове этого метода применяются 
соответствия, перечисленные в табл. 12.1: 
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Таблица 12.1. Соответствие методов подпрограммам 


Вызов метода Итоговый вызов подпрограммы 


Сгіїттег->ѕрамт() Сгіїтег::ѕрамп("Сгіїтег") 


Ѕрідег->ѕрамп() Сгіїтег::ѕрамп( `Ѕр1дег”) 

В обоих случаях вызывается одна и та же подпрограмма, но с разными аргумен- 
тами. Обратите внимание, что конструктор зрамп, приведенный выше, игнориру- 
ет свой аргумент, а это значит, что объект Эр1дег будет ошибочно «благословлен» 
в класс Сгіігег. Более правильный конструктор должен передать функции 01е55 
имя пакета (полученное в первом аргументе): 


ѕир ѕрамп { 
ту $с1а55 = зпа Е; # Сохранить имя пакета 
ту $ѕе1ғ ={}; 
01е$$($зе1+1, $с1аз$), # "Благословить" ссылку в этот пакет 
гефигп $зе1Е; 


} 
Теперь в обоих случаях можно использовать одну и ту же подпрограмму: 


фуегтіп = Сгіїтег->ѕрамп; 
$ѕһе106 = 5рібег->эрамп; 


И каждый объект будет принадлежать правильному классу. Выбор правильного 
класса гарантируется даже при косвенном вызове: 


Ш 


Фуре "Зрзаег”; 
$ѕһе100 = $#уре->ѕрамп: # То же, что и "Ѕрідег”->5рамп 


Это по-прежнему метод класса, а не экземпляра, потому что его инвокант содер- 
жит строку, а не ссылку. 


Будь переменная $1уре объектом, а не именем класса, текущее определение кон- 
структора не работало бы, потому что функция 01е55 требует имени класса. Но 
для многих классов есть смысл использовать существующий объект в качестве 
шаблона для создания нового объекты. В таких случаях можно создавать конст- 
рукторы, работающие и с объектами, и с именами классов: 


ѕиб зрами { 
ту $іпуосапт = зи т; 
пу $с1а55 = геё(ф$іпмосапё) |[ $1пуосапё; # Объект или имя класса 
пу $е1? = { }, 
61е55($561#, $сЈа55); 
геёигп $ѕе1ғ; 

} 

Инициализаторы 


Большинство объектов хранит внутреннюю информацию, которая косвенно об- 
рабатывается методами объекта. До сих пор все наши конструкторы создавали 
пустые хеши, но нет причин оставлять их пустыми. Например, конструктор мог 
бы принимать дополнительные аргументы и хранить их в хеше парами вида 
ключ/значение. В литературе по ООП такие данные часто называются свойства- 
ми, атрибутами, методами доступа, данными-членами, данными экземпляра 
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и переменными экземпляра (ргорегнез, атігіђиіеѕ, ассеѕѕогѕ, тетфег ааа, іпѕїап- 
се аа, іпзіапсе сапа дез). Более подробно атрибуты обсуждаются в разделе «Пе- 
ременные экземпляра», далее в этой главе. 


Представим себе класс Ногзе (лошадь) с атрибутами «пате» (кличка) и «соог» 
(масть): 


$5теед = Ногзе->пеи(пате => `ЗпадомРах“, со1ог => “мһіїе”); 


Если объект реализован как ссылка на хеш, пары ключ/значение можно интер- 
полировать непосредственно в хеш, как толькс инвокант будет удален из списка 
аргументов: 


ѕиб пем { 
пу $іпуосапї = ѕһіғі; 
пу $С1аз$ = геЁ($іпуосапї) || $іпуосапї; 
пу $ѕеї? = { @ }; # Оставшиеся аргументы становятся атрибутами 
б1еѕѕ($ѕе1т, $с1аз$); # "Благословение" в объекты 
геёигп $е1ғ; 
} 


На этот раз в качестве конструктора класса мы использовали метод с именем пем, 
что может создать у программистов на языке С++ ложное ощущение понимания 
происходящего. Для Регі слово «пеу» не имеет специального значения; конструк- 
торы можно называть как угодно. Любой метод, создающий и возвращающий объ- 
ект, является конструктором де ѓасіо. В целом, мы советуем давать конструкто- 
рам осмысленные в контексте решаемой задачи имена. Например, конструкторы 
в модуле ТК имеют имена, соответствующие создаваемым графическим объектам. 
В модуле 081 конструктор соппесї возвращает объект — дескриптор базы данных, 
а другой конструктор, ргераге, вызывается как метод экземпляра и возвращает 
объект – дескриптор команды. Но если нет подходящего в данном контексте имени 
конструктора, пем станет не самым ужасным выбором. Ну, аесли выбрать какое-то 
случайное имя, это заставит пользователей прочесть контракт интерфейса (т.е. 
документацию класса), прежде чем использовать его конструкторы. 


Далее, можно оснастить свой конструктор парами ключ/значение по умолчанию, 
которые пользователь сможет переопределить с помощью аргументов: 


346 пем { 

пу фіпуосапї = ѕһіғї; 

пу $С1а$$ = геғ($пуосапт) || $іпуосапї; 

пу $%е1ғ = { 
со10г => "гнедой" 
1005 = 4, 
омпег => џпае#, 
©, # Заместить прежние атрибуты 


}; 
гефигп 61е$$ $зе1+е, $с1а55; 
} 


$еа Ногѕе->пем; # 4-ногая гнедая лошадь 
$ѕ+та11іоп = Ногзе->пем(со1ог => черный”); # 4-ногая вороная лошадь 


При использовании в качестве метода экземпляра конструктор Ногѕе игнориру- 
ет атрибуты инвоканта. Можно было бы создать второй конструктор, предназна- 
ченный для вызова в качестве метода экземпляра, и сделать так, чтобы значения 
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вызывающего объекта принимались как значения по умолчанию для атрибутов 
нового объекта: 


фоїееа = Ногзе->пем(со1ог => “серовато -коричневый"); 
$Роа1 = $з1еед->с1опе(омпег => “Едиибеп би119, 119 ”); 
ѕиб с1опе { 


ту $тоде] = 5һі#Ү; 

пу $зе11 = $тюде1 ->пем(%$тоде1, @ ); 

гефигп $5е1?; # Ранее “благословленный” с помощью ->пем 
} 


(Эти инструкции можно поместить прямо в пем, но тогда имя будет не вполне со- 
ответствовать функции.) 


Обратите внимание, что даже в конструкторе с1опе мы не кодируем жестко имя 
класса Ног ѕе. Исходный объект, чем бы он ни был, вызывает свой собственный ме- 
тод пем. Если бы вместо $тоде1->пем мы написали Ногѕе->пем, этот класс не позво- 
лил бы наследовать его классам Зебра или Единорог. Не хотелось бы, клонируя 
Пегаса, получить лишь лошадь другой масти. 


Иногда, однако, возникает противоположная проблема: вместо того, чтобы делить 
один конструктор между несколькими классами, желательно иметь несколько 
конструкторов в одном классе, например, чтобы вызвать конструктор базового 
класса перекладывая на него часть работы. Рег| создает объекты без учета поло- 
жения их классов в иерархии, т.е. он не вызывает автоматически конструкторы 
(или деструкторы) базовых классов, поэтому вашему конструктору придется сде- 
лать это самостоятельно, а затем добавить дополнительные атрибуты, необходи- 
мые производному классу. Ситуация отчасти сходна с подпрограммой с1опе, за 
исключением того, что вместо копирования существующего объекта в новый не- 
обходимо вызвать конструктор базового класса, а затем превратить новый объект 
базового класса в объект производного класса. 
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Следуя установленной традиции, в системе объектов Рег! наследование одного 
класса другим не требует особого синтаксиса. При вызове метода, для которого 
нет подпрограммы в пакете инвоканта, Ретх| исследует массив @15А! этого пакета. 
Вот как Ре! реализует наследование: каждый элемент массива @ГЗА данного па- 
кета содержит имя другого пакета, в котором производится поиск отсутствую- 
щих методов. Так, в следующем примере класс Ногѕе становится подклассом 
класса Сгіїїег. (Мы объявляем массив @15А как сиг, потому что он должен быть пе- 
ременной пакета, а не лексической переменной, объявленной через пу.) 


раскаде Ногѕе; 
биг @ТЗА = "Сгіїтег" 


То же самое можно реализовать с применением прагмы рагепї, которая обрабаты- 
вает @15А автоматически и загружает родительский (рагепі) класс: 


раскаде Ногѕе; 
изе рагепі дм(Сг1ї+ег), 


1 Произносится «из э», как в «А һогѕе 1$ а с Мег» (лошадь — это животное). 
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Прагма рагепї пришла на смену устаревшей прагме разе, которая выполняла те 
же операции, но применяла волшебство с прагмой ѓіе145, если предполагала, что 
поля используются суперклассами. Если вы не слышали о ней, не волнуйтесь 
(а просто пользуйтесь прагмой рагеп{): 


раскаде Ногѕе; 
изе Базе дм(Сгіїтег); 


Теперь класс Ногзе или объект можно использовать везде, где прежде использо- 
вался класс Сгіїїег. Если ваш новый класс пройдет эту проверку на пустой под 
класс, вы будете знать, что Сгіїіег является правильным базовым классом, при- 
годным для наследования. 


Допустим, что в $51еед находится объект Ногзе, и вы вызываете его метод поче: 


$этеед->то\е(10); 


Поскольку $ѕтеей является объектом Ногѕе, Рег попытается найти для этого ме- 
тода подпрограмму Ногзе: :поуе. В случае неудачи Ре! не возбуждает исключи- 
тельную ситуацию на этапе выполнения, а обращается к первому элементу мас- 
сива @Ногѕе::І5А, который отправляет его в пакет Сг1ттег на поиски Огіїїег::похе. 
Если и эта подпрограмма не будет найдена, а в Сгіїїег есть собственный массив 
@Сгіїтег::ІЅА, поиск будет продолжен в следующем пакете-предке, который мог 
бы предоставить метод пох. Такое движение вверх по иерархии наследования бу- 
дет продолжаться до достижения пакета, в котором нет @15А. 


Описанная только что ситуация называется одиночным наследованием (те 
тйегйапсе): у каждого класса есть только один родитель. Такое наследование по- 
добно связному списку родственных пакетов. Ре] поддерживает также множест- 
венное наследование (тише тпегйапсе); достаточно добавить еще пакеты в @15А 
класса. Такого рода наследование действует скорее как древовидная структура 
данных, потому что у каждого пакета может быть более одного непосредственно- 
го родителя. Некоторые находят, что это более сексуально. 


При вызове метода леѓлпате с инвокантом типа с1а55пате Рей опробует шесть раз- 
ных способов, чтобы найти подпрограмму, которую нужно использовать: 


1. Сначала Рег] пытается найти подпрограмму с именем с!255гапе::теѓђпапе в па- 
кете инвоканта. Если это не удается, включаются механизмы наследования, 
и мы переходим к шагу 2. 


2. Далее Рег1 проверяет методы, унаследованные от базовых классов, просматри- 
вая все пакеты рагепё, которые перечислены в @сС1аззпате: .І5А, в поисках под- 
программы рагепЕ: : пе ппате. Поиск ведется слева направо, рекурсивно и сна- 
чала вглубь. Рекурсия обеспечивает проведение поиска во всех классах — пра- 
родителей, прапрародителей, прапрапрародителей и т.д. 

3. Если поиск не дал результатов, Ре! проверяет наличие подпрограммы с име- 
нем ИМТУЕНЗАЕ: : пефппаме. 


4. В этом месте Рег! отчаивается найти пегппате и начинает искать АИТО1ОАВ. Сна- 
чала он ищет подпрограмму с именем с1а55пате: :А0ОТОГОАР. 


5. В случае неудачи поиск продолжается во всех пакетах рагепі, перечисленных 
в @бс1аззпате: :15А, пока не будет найдена подпрограмма рагепЕ: : АУТОГОАО. Поиск 
опять ведется слева направо, рекурсивно и сначала вглубь. 


6. Наконец, Рег] пытается найти подпрограмму с именем УМТ\/ЕВЗА! : : АУТОГОАВ. 
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Ре прекращает поиск после первого же совпадения и вызывает соответствую- 
щую подпрограмму. Если подпрограмма не найдена, возбуждается исключитель- 
ная ситуация (которую вы будете наблюдать нередко): 


Сап'{ 1осафе орјесі теїһоа “тефппате”“ уіа раскаде "с1аѕѕпате" 
(Не могу найти метод “тефппате”“ объекта через пакет “с1аззпате”)} 


Если ваша версия Рег! собрана с поддержкой отладки при помощи опции компи- 
лятора -ООЕВИССТЮС, то при запуске Рей с ключом -ро можно увидеть прохождение 
всех этих этапов во время поиска вызываемого метода. 


По мере изложения мы будем обсуждать механизм наследования более подробно. 


Наследование через @15А 


Если массив @15А содержит больше одного имени пакета, поиск в пакетах осуще- 
ствляется в порядке слева направо. Поиск ведется сначала вглубь, поэтому, если 
у вас есть класс Ме (мул), наследующий классы, как показано ниже: 


раскаде Мије; 
сиг @ІЅА = ("Ногѕе”, “Бопкеу”); 


поиск методов, отсутствующих в Ми]е, сначала будет выполняться в классе Ногѕе 
(и всех его предках. например, Сгіїїег) и только потом в классе Оопкеу (осел) и его 
предках. 

Если отсутствующий метод найдется в базовом классе, Ре! сохранит его местопо- 
ложение во внутреннем кэше текущего класса для повышения эффективности, 
т.е. когда данный метод потребуется найти еще раз, за ним не придется далеко 
ходить. Изменение 6Т5А или определение новых методов делает кэш недействи- 
тельным и заставляет Рег! снова проводить поиск. 


При поиске метода Регі проверяет, не создана ли циклическая иерархия наследо- 
вания. Это может произойти, если два класса наследуют друг друга, в том числе 
косвенно, через другие классы. Попытка стать собственным прадедом парадок- 
сальна даже для Регі, поэтому она вызывает исключение. Однако Ре! не считает 
ошибкой наследование от нескольких классов, имеющих общих предков, что, 
скорее, напоминает брак между кузенами. Иерархия наследования просто пере- 
стает быть деревом и начинает выглядеть как направленный ациклический граф. 
Ре! это не заботит, пока граф действительно остается ациклическим. 


Когда устанавливается значение @15А, присваивание происходит обычно на этапе 
выполнения, поэтому, если не принять мер предосторожности, код в блоках ВЕСІМ, 
СНЕСК и ІМІТ не будет иметь возможность использовать иерархию наследования. 
Одним из средств предосторожности (или удобства) является прагма рагепт, кото- 
рая позволяет выполнять гедиіге для классов и добавлять их в @15А на этапе ком- 
пиляции. Вот как можно ее использовать: 


раскаде Ми]е; 
иѕе рагепі ("Ногѕе”, “Вопкеу”), # объявление надклассов 


Это сокращенная форма записи следующего фрагмента: 


раскаде Ми1е; 
ВЕСТМ { 
сиг @ІЅА = ("Ногѕе", "Ропкеу"); 
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геди1ге Ногѕе; 
гедиіге ропкеу; 


} 


Некоторых удивляет, что включение класса в @ТЗА не влечет геди1ге соответствую- 
щего модуля. Это связано с тем, что система классов Рей в значительной мере ор- 
тогональна его системе модулей. В одном файле может содержаться несколько 
классов (поскольку они являются просто пакетами), а один пакет может упоми- 
наться в нескольких файлах. Но в обычной ситуации, когда один пакет, один 
класс, один модуль и один файл в конечном итоге оказываются взаимозаменяе- 
мыми (если сильно прищуриться), прагма рагеп{ предлагает синтаксис объявле- 
ния, который устанавливает наследование и загружает файлы модулей. Это одна 
из удобных диагоналей, о которых мы постоянно говорим. 


Дополнительные сведения можно найти в описании ц5е рагепт в главе 29. Прочти- 
те также описание устаревшей прагмы баѕе (впавшей в немилость у программи- 
стов на Рег), которая использует волшебство прагмы 11е14$. 


Альтернативный способ поиска методов 


В случае множественного наследования стандартный поиск методов обходом @1№С 
может находить неправильный метод, потому что метод более удаленного над- 
класса может скрыть требуемый метод, реализованный в более близком надклас- 
се. Взгляните на дерево наследования, представленное на рис. 12.1, где класс М№1е 
наследует два других класса, ропкеу и Ногѕе, каждый из которых наследует класс 
Едиіпе. Класс Едџіпе имеет метод с010г, наследуемый классом Оопкеу. Класс Ногѕе 
имеет собственный метод с010г. При использовании механизма поиска по умолча- 
нию, нельзя сказать, какой метод будет вызван, если не знать, в каком порядке 
просматриваются родительские классы: 


иѕе рагепе дм(Ногзе Оопкеу); # первым будет найден Ногзе: :Со1ог 
иѕе рагепі дм(ропкеу Ногзе); # первым будет найден Едилте: :Соїог 


Рис. 12.1. Дерево множественного наследования 
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Начиная с версии у5.10 порядок обхода родительских классов можно настраи- 
вать. Порядок поиска методов можно установить с помощью прагмы пго (см. гла- 
ву 29): 


раскаде Миле; 
иѕе тго `с3`, 
изе рагепї ам(ропкеу Ногзе); 


Алгоритм СЗ так выполняет обход массивов @Т\С, что обнаруживает унаследован- 
ные методы в наиболее близких надклассах. Иными словами, ни один надкласс 
не будет просматриваться, пока поиск не будет закончен в его подклассах. Рей не 
станет просматривать класс Едиџіпе, пока не просмотрит класс Ногѕе. 


Если ваша версия Ре! не поддерживает прагму пго, можете воспользоваться мо- 
дулем МНО: :Сопрат из архива СРАМ. 


Доступ кзамещенным методам 


Когда класс определяет метод, эта подпрограмма замещает одноименные методы 
во всех базовых классах. Представьте, что у вас есть объект Ми1е (производный от 
класса Ногѕе и класса Попкеу), и вы решаете вызвать метод 0геед (скрещивание) ва- 
шего объекта. Хотя у родительских классов есть собственные методы ргеед, раз- 
работчик класса Ми1е заместил их, снабдив класс Ми]е собственным методом бгеей. 
Это значит, что следующее скрещивание вряд ли будет продуктивным: 


фэфа111оп = Ногѕе->пем(депдег => “та1е“); 
$то11у = МиТе->пем(депдег => "Ғета1е”); 
фсо1ї = $то11у->6геед($${а11100); 


Теперь допустим, что чудеса генной инженерии позволили вам решить извест- 
ную проблему стерильности мула, и вы хотите перескочить через нежизнеспособ- 
ный метод Ми] е: :ргееа. Свой метод можно вызвать как обычную подпрограмму, не 
забыв явным образом передать инвоканта: 


$с011 = Ногзе: :ргеед($то11у, $$Тта1110п); 


Однако это делается в обход наследования, что почти всегда не лучшая идея. 
Вполне можно представить, что подпрограммы Ногѕе::огеей не существует, пото- 
му что Ногѕе и ропкеу наследуют это свое поведение от общего родительского клас- 
са Едџіпе. Если, с другой стороны, необходимо указать Рег], чтобы он начал поиск 
метода в определенном классе, выберите обычный метод вызова, но квалифици- 
руйте имя метода именем класса: 


$с01 = $то11у->Ногѕе: :ргеей($5та111ог.) 


Иногда требуется, чтобы метод производного класса действовал как обертка во- 
круг некоторого метода базового класса. Метод в производном классе может сам 
вызвать метод базового класса, выполняя дополнительные операции до или по- 
сле этого вызова. Только что продемонстрированный способ записи позволяет 
также указать, в каком классе начинать поиск. Но чаще, применяя замещенные 
методы, желательно избавиться от необходимости явно указывать родительский 
класс, замещенный метод которого должен выполняться. 


426 Глава 12. Объекты 


В таких случаях удобно использовать псевдокласс РЕВ. Он позволяет вызвать 
замещенный метод базового класса, не указывая, в каком классе этот метод опре- 
делен.! Следующая подпрограмма отыщет текущий пакет в @15А, не заставляя вас 
указывать конкретные классы: 


раскаде Ми1е; 
сиг @ТЗА = дм(Ногзе Бопкеу); 
$и6 Кіск { 
пу $ѕе1? = эВ1ЕЕ; 
ргіп “Мул лягается! \п”; 
ф5е1ғ->ЏРЕВ: :кіск(@ ); 
} 


Псевдопакет $0РЕН имеет значение только когда применяется внутри метода. Ав- 
тор класса может включить $РЕВ в свой код, но тот, кто просто использует объек- 
ты класса, – нет. 


При использовании алгоритма поиска методов СЗ вместо ЗИРЕВ: :МЕТНМАМЕ следует 
использовать пехї::пеїћоа, загружаемый прагмой изе пго “с3". В отличие от ЗРЕВ, 
при обращении к пехї::пеїћоа не требуется указывать имя метода, потому что оно 
подразумевается по умолчанию: 


зе у5.14; 
раскаде ме; 
иѕе тго ‘с3`; 
изе рагепї ди(ногзе Ббопкеу); 
зир Кіск { 
пу $ѕе1# = ѕһћіғ+; 
ѕау "Мул лягается!`, 
$ѕе17->пехї: :теһоа(@ ); 
} 


В любой точке кода на нзыке Рей известно, какой пакет является текущим, т.е. 
определен последней инструкцией раскаде. Метод ЗИРЕН просматривает массив 
@ТЗА только того пакета, который был текущим на момент компиляции вызова 
ЗУРЕВ. Его не интересуют ни класс инвоканта, ни пакет вызываемой подпрограм- 
мы. Это может послужить источником проблем, если попытаться определить ме- 
тоды в другом классе путем лишь манипуляций с именем метода: 


раскаде В1га; 
ие Огачоп Ту; 
ѕир Огадоп Ту: :91уеботб { $111->50РЕН: : діуеоотр(ё ) } 


К несчастью, в этом примере будет вызван надкласс Вігд, а не Огадоп 1у. Чтобы 
осуществить то, что задумывалось, нужно явно перейти в соответствующий па- 
кет, и тогда вызов ЗУРЕН скомпилируется правильно: 


раскаде Віга; 
иѕе Огадоп?1у; 
{ 
раскаде ОгадопТ1у; 


Не надо путать это с механизмом, о котором говорилось в главе 11; тот служит для за- 
мещения встроенных функций Ре!|, не являющихся методами объектов и потому не 
замещаемых путем наследования. Замещенные функции вызываются через псевдопа- 
кет СОНЕ, а не псевдопакет ИРЕНА, 
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ѕир дімерото { 5ћіғі->ЅИРЕВ: :дімеботр(@ ) } 
} 


Метод пехі::пеіћоа страдает похожей проблемой, потому что он использует па- 
кет, которому принадлежит вызывающий его код, чтобы определить, в каком 
классе следует искать. Если определить метод в классе ропкеу из другого пакета, 
пехїі::теїћос@ не найдет его: 


раскаде таїіп; 
*"”опкеу: :ѕоипд = зи6 { (5ћіҒЕ)->пехї: :тећоа(@ ) у; 


Анонимная подпрограмма фигурирует в стеке как __АМОМ__, поэтому пехї::теіћой 
не сможет определить, в каком пакете она находится. Однако проблему можно 
решить с помощью модуля 500::№апе из архива СРАМ: 


изе 500: :Мате дм(ѕирпапе); 
*бопкеу: : ѕоипа = 
зибпате `Ропкеу: :з0ип9° => ѕир { (=һћіҒЕ)->пехї: :тећой(@ ) } 


Как показывают эти примеры, необязательно редактировать файл модуля, чтобы 
добавить новые методы в существующий класс. Поскольку класс является про- 
сто пакетом, а метод — просто подпрограммой, нужно лишь определить функцию 
в нужном пакете, что мы здесь и сделали, и в классе внезапно появится новый 
метод. Никакого наследования не требуется. Значение имеет только пакет, а так 
как пакеты являются глобальными, то доступ к любому пакету может быть осу- 
ществлен из любого места программы. (Кстати, мы уже говорили, что собираемся 
на следующей неделе установить джакузи у вас в комнате?) 


ОММЕВЗА!: первичный класс предков 


Если в результате поиска в классе инвоканта и рекурсивного поиска во всех клас- 
сах, являющихся его предками, не будет найдено определение метода с нужным 
именем, будет выполнена еще одна попытка найти метод с этим именем в особом 
предопределенном классе с именем ОМТУЕНЗА!. Этот пакет никогда не указывается 
в @Г5А, но проверка в нем выполняется всегда, если поиск по @ТЗА не дал результатов. 
Можно считать ИМТУЕВЗАЕ всеобщим прародителем, который неявно наследуют все 
классы, подобным классу Објесї в Јауа или орјесї для классов нового стиля в Руіћоп. 


Ниже описаны предопределенные методы, имеющиеся в классе ИМТУЕВЗА!, а сле- 
довательно и во всех классах. Все они работают независимо от того, вызываются 
ли они как методы класса или как методы объекта. 


ІМУОСАМТ->іѕа(С1455) 


Метод іѕа возвращает истинное значение, если классом ивоканта ТМУОСАКТ яв- 
ляется (1455 или любой класс, наследующий (1455. При этом (1455 может быть 
не именем пакета, а одним из встроенных типов, например, “НАЗН" или “ААВАҮ". 
(Однако выяснение точного типа не сулит ничего хорошего инкапсуляции 
и полиморфизму. Чтобы получить правильный метод, следует полагаться на 
диспетчеризацию методов.) 


иѕе ТО: : Напа1е; 

11 (10: :Напдїе->ізѕа("Ехрогтег")) { 
ргіпЕ “ТО: :Напд1е есть Ехрогёег.\п” 

} 
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ФЕН = ТО: :Напд1е->пем(), 
1Е ($Ғһ->іѕа(”І0..Напад1е”)) { 
ргзпЕ “\$#һ есть какой-то объект І0.\п": 
} ЇР (ФҒһ->іѕа("Сі0В")) { 
ргіпї “\$#һ есть ссылка на СОВ. \п” 
} 


ТМУОСАМТ->ООЕЗ(ВОЕЕ) 


В Реп у5.10 появилось понятие ролей, способа включения в класс внешних ме- 
тодов без необходимости наследовать их, как того требует 15а. Роль определяет 
набор поведенческих характеристик, но не указывает, как они должны под- 
держиваться классом. Это может быть наследование методов, их имитация, 
делегирование другим классам или что-то иное. 


По умолчанию метод 00Е5 действует идентично методу 15а, и его можно ис- 
пользовать вместо 15а во всех случаях. Однако, если класс делает нечто осо- 
бенное, чтобы включить методы без наследования, необходимо определить ме- 
тод 00Е5, если необходимо обеспечить получение правильного ответа. 


Роли - это идея из Реп 6, и правда в том, что в Рег] 5 они вообще никак не ис- 
пользуются. Метод ИМТУЕНЗАЕ 00Е5 существует, только чтобы обеспечить со- 
трудничество классов, которые включают методы друг друга, где метод 00Е5 
имеет большое значение. Но сам Ре’ не уделяет ролям никакого внимания. 


ТМУОСАМТ->сап(МЕТНОР) 


Метод сап возвращает ссылку на подпрограмму, вызываемую в случае приме- 
нения МЕТНО к ТМУОСАМТ. Если такан подпрограмма не будет найдена, возвраща- 
ется ипдет. 


1 ($1пуосапт->сап("сору”)) { 
рг1и{ "Наш инвокант умеет копировать. \п”; 


} 


Это можно использовать, чтобы вызывать метод только при условии его суще- 
ствования: 


$063 ->зпаг1 1Р $06)->сап(” паг? ` 


При множественном наследовании это позволяет методу вызвать все замещен- 
ные методы базового класса, а не только самый левый: 


зиб зпаг]1 { 

пу $зе1 = Ват; 

рг1пЕ "Ворчащие (ѕпаг1іпо): @ \п': 

ту %зееп; 

ог му $рагепі (@ТЗА) { 
11 (ту $соде = $рагепі->сап("ѕпаг1“)) { 

фве1?->$соде(@ ) оп1еѕѕ $зееп{$соде}++; 

} 


} 


Мы используем хеш %зееп, чтобы следить за тем, какие подпрограммы уже вы- 
зывались, и избежать повторного вызова одной и той же подпрограммы. Это 
могло бы произойти, будь у нескольких родительских классов общий предок. 
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Методы, приводящие к срабатыванию АЦТОГ ОАО (описывается в следующем раз- 
деле), учитываются неточно, за исключением случая, когда в пакете объявле- 
ны (но не определены) подпрограммы для автоматической загрузки. 


При использовании прагмы пго вместо этого метода, вероятно, лучше исполь- 
зовать метод пехї: :сап. 


4МУОСАМТ->МЕВЗТОМ( МЕЕО) 


Метод \УЕВЗТОМ возвращает значение номера версии класса инвоканта глу0САЛТ, 
хранящееся в переменной пакета $\/Е|ЗТОМ. Если передается аргумент МЕЕР, ме- 
тод сравнивает его с текущей версией. Если текущая версия оказывается мень- 
ше, чем Л№ЕЕ?, — возбуждает исключительную ситуацию. Этот метод использует 
иѕе, чтобы определить, достаточно ли свеж модуль. 


изе Тһгеаа 1.0; # вызовет Гһгеад->МЕВЅ:10№(1.0) 
ріп “Выполняется Тигеад версии “, Тһгеаа->МЕВЅІОМ№, ” \п”; 


Вы можете создать собственный метод МЕВЅІ0№ для замещения метода в ЏМІМЕВЅАІ. 
Однако при этом все классы, производные от вашего, тоже будут использовать 
замещающий метод. Чтобы этого не произошло, метод должен отправлять за- 
просы версии, исходящие от других классов, снова в ЏМІМЕВЅА!. 


Методы в УМТ\УЕНЗА! — это встроенные подпрограммы Регі, которые можно вы- 
зывать, полностью квалифицируя их и передавая два аргумента, например 
ОМІМЕВЅАС::іѕа($#огтобј, “НАЗН”). Однако при этом не выполняются некоторые про- 
верки, поскольку $ѓогпобј может быть любым значением, а не только ссылкой. 
Вызов метода можно было бы заключить в ловушку е\а1: 


вуа1 { ИМТМЕЯЗАГ: :15а($Ғогторј, “НАЗН”) } 


Делать так, впрочем, не рекомендуется, поскольку ответ на ваш вопрос обычно 
может дать сап. 


ема1 { ОМТМЕВЅАГ: :сап($тогтоој, $теёћоа) } 


Если же вас беспокоит, является ли переменная $ѓогпорј объектом, и вы желаете 
завернуть вызов метода в е\а1, ее также можно использовать как объект, посколь- 
ку ответ останется прежним (вы не сможете вызвать этот метод для $Ғогпобј): 


ема1 { $Ғогтобј->сап( $теїһод ) } 


В класс ИМТУЕНЗАЕ можно добавлять собственные методы. (Конечно, следует про- 
являть осторожность: можно запутать кого-либо, кто рассчитывает нё. отсутст- 
вие метода с определенным вами именем и осуществление его автозагрузки из 
другого места.) Сейчас мы создадим метод сору, который могут использовать объ- 
екты всех классов, не имеющие собственного метода. При этом мы демонстриру- 
ем зрелищный сбой, если метод вызван для класса, а не объекта: 


изе Вата: :Оотрег: 
изе Сагр; 
ѕџр УМТУЕНЗАЕ : :сору { 
ту $5е1Р = =һіҒ+; 
11 (геғ $е1#) { 
гетигп ема1 Оитрег($ѕе1#); # ссылки на С00Е не допускаются 
} е1ѕе { 
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сопѓеѕѕ “омТУЕНЗАЕ: :сору не может копировать класс $е1#“; 


} 


Эта стратегия ага: :битрег не работнет, если объект содержит ссылки на подпро- 
граммы, потому что они не могут быть правильно воспроизведены. Даже будь 
доступен исходный код, лексические привязки потерялись бы. 


Автозагрузка методов 


Обычно при обращении к несуществующей подпрограмме в пакете, который оп- 
ределяет подпрограмму АПТОГОА, вместо возбуждения исключительной ситуации 
вызывается подпрограмма АЦТОГОАО (см. раздел «Автозагрузка» главы 10). Для ме- 
тодов это действует несколько иначе. Если обычный поиск метода (через класс, 
его предков и, наконец, ИМТУЕВЗА!) не дает соответствия, та же последовательность 
поиска выполняется снова, но на этот раз производится поиск подпрограммы 
АЈТОІ ОАР. Если она найдена, то вызывается в качестве метода, при этом перемен- 
ная пакета $АЏТОГ0АЮ устанавливается равной полностью квалифицированному 
имени подпрограммы, от имени которой была вызвана АПТОГОАО. 


При автозагрузке методов следует проявлять некоторую осторожность. Во-пер- 
вых, подпрограмма АЧТОГОАВ должна немедленно осуществить возврат, если вызва- 
на от имени метода ОЕЗТНО\, если только вашей целью не была эмуляция ОЕЗТНОУ, 
имеющего в Регі особое значение, как описано в разделе «Деструкторы экземпля- 
ров» далее в этой главе. 


500 АЏТОГОАР { 
геигп і? оиг Ф$АШТОГОАРЮ =- /: : ПЕЅТВОҮ$/; 


} 


Во-вторых, если класс предоставляет страховку на основе АШТОІ ОАВ, невозможно 
использовать ИМТУЕВЗА|::сап с именем метода, чтобы проверить, безопасно ли его 
вызывать. Проверять А0ТОІ0А0 нужно отдельно: 


1 ($00ј->сап(“тетһпате”) || $067->сап(“АУТОГОА”)) { 
$063 ->тефппате(); 
} 


Наконец, когда при множественном наследовании класс наследует два или более 
классов, в каждом из которых есть АШТОГ ОАР, запускается только самый левый из 
них, так как Рей останавливается, найдя первый АПТОГОАО. 


Последние две странности легко обойти, объявив подпрограммы в пакете, чей 
АОТОГОАО должен управлять этими методами. Можно сделать это с помощью от- 
дельных объявлений: 


раскаде б60611п; 
зиб КіСк; 

зи Біїе; 

зи ѕсгаїспћ, 


или с помощью прагмы 316$, что более удобно, если объявляемых методов много: 


раскаде 606111; 
иѕе ѕирѕ ам(кіск біте ѕсгаїсћ); 
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Эти подпрограммы объявлены, но не определены, однако системе этого достаточ- 
но, чтобы считать их существующими. Они видны при проверке ОМТУЕНЗА! ::сап и, 
что более важно, на шаге 2 поиска метода, так что поиск никогда не перейдет 
к шагу 3, не говоря уже о шаге 4. 


«Но послушайте», — воскликнете вы, — «они же вызывают АЏТОІОАР, не так ли?». 
В конечном счете, да, но механизм этого иной. Найдя на шаге 2 заглушку метода, 
Рей попытается вызвать его. Если обнаружится, что метод - не то, чем ему пола- 
гается быть, снова начнется поиск метода АЦТОГОАО, но на этот раз поиск начнется 
в классе, содержащем заглушку, что ограничивает поиск этим классом и его 
предками (и ИМТУЕНЗА!). Благодаря этому Рег! находит для запуска правильный 
АОТОГОАО и умеет игнорировать методы АОТО1ОАО, находящиеся в неподходящей 
части исходного дерева наследования. 


Закрытые методы 


Есть такой способ вызова метода, при котором Рег вообще игнорирует наследова- 
ние. Если вместо литерального имени метода задать простую скалярную пере- 
менную, содержащую ссылку на подпрограмму, то подпрограмма вызывается 
непосредственно. В описании ИМТ\УЕВЗА!->сап в предыдущем разделе последний 
пример вызывает все замещенные методы с помощью ссылки на подпрограмму, 
а неее имени. 


Интересно, что такой режим можно применять для реализации вызовов закрытых 
методов. Если поместить класс в модуль, лексическую область видимости файла 
можно будет использовать для создания закрытых методов. Сначала сохраним ано- 
нимную подпрограмму в лексической переменной с файловой областью видимости: 


# объявление закрытого метода 
ту $ѕесгеї_доог = ѕир { 
ту $5е1# = ѕһіғї; 


}; 


Далее переменную можно использовать в этом файле, как если бы она содержала 
имя метода. Замыкание будет вызвано непосредственно, невзирая на наследова- 
ние. Как и для любого другого метода, в качестве дополнительного аргумента пе- 
редается инвокант. 


$и6 Кпоск { 
пу $5е1# = ЅһіЎҮ, 
ЇҒ ($5е1#->{Ккпоскеа}++ > 5) { 
$ѕь1Ғ->$ѕесгеї доог(); 


} 


Это позволяет собственным подпрограммам файла (методам класса) вызывать 
метод, недоступный вне лексической области видимости. 


Деструкторы экземпляров 


Как и для любого другого объекта ссылки в Рен, как только исчезает последняя 
ссылка на объект, его память неявно освобождается для повторного использова- 
ния. Объекты позволяют перехватить управление непосредственно перед тем, 
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как это произойдет, путем определения подпрограммы 0Е5ТВ0Ү в пакете класса. 
Этот метод автоматически запускается в нужный момент, и в качестве единствен- 
ного объекта ему передается объект, который вот-вот должен быть уничтожен. 


Деструкторы редко требуются в Рет], потому что управление памятью осуществ- 
ляется автоматически. Однако некоторые объекты могут владеть ресурсами за 
пределами памяти, и о них желательно было бы позаботиться; например, это ка- 
сается дескрипторов файлов и соединений с базами данных. 


раскаде Ма11М№от1ғу; 
ѕир ОЕЗТВОУ { 
ту $ѕе1# = =һіғі; 
пу $#ђ = фѕе1#-> {таі1іһапд1е}; 
пу $19 = $5е1ғ-> {пате}; 
ргіпі $#һ “\п$19 отключается в “ 1оса1їіпе() \п”; 
с1оѕе $#һ, # закрыть канал обработчика почты 


} 


Для создания объекта достаточно единственного метода, даже если класс конст- 
руктора наследует один или несколько других классов. Точно так же Рег! исполь- 
зует всего один метод ОЕЗТВОУ для каждого объекта, невзирая на наследование. 
Иными словами, Рег! не станет выполнять иерархическое уничтожение. Если 
ваш класс замещает деструктор надкласса, вашему методу ОЕЗТВОУ может понадо- 
биться вызвать метод ПЕЅТАОҮ всех соответствующих базовых классов: 


зи БЕЗТВОУ { 
пу $5е1# = өһіГТ; 
# Проверка замещения деструктора. . 
$зе1Е->5РЕН: : ОЕЗТНОУ і? $ѕе1#->сап( "ОРЕН: : ВЕЅТВОҮ" ); 
# теперь делайте свои собственные дела 


} 


Это относится только к производным классам; объект, который просто содержит- 
ся в текущем объекте - как, например, одно значение в более крупном хеше — 
будет освобожден и уничтожен автоматически. Это одна из причин, по которым 
вложенность путем простого агрегирования (иногда называемая отношением 
«һаѕ-а» — «имеет») часто является более простой и понятной, чем наследование (от- 
ношение «іѕ-а» — «является»). Иными словами, часто достаточно поместить один 
объект внутрь другого, избегая наследования, которое вносит ненужную слож- 
ность. Иногда пользователи хватаются за множественное наследование, в то время 
как вполне достаточно одиночного. 


Явный вызов ОЕЗТВОУ допускается, но редко требуется. Он может даже оказаться 
вредным, поскольку повторный запуск деструктора одного и того же объекта мо- 
жет привести к неприятным последствиям. 


Сборка мусора методами ОЕЅТКОҮ 


Как описывалось в разделе «Сборка мусора, циклические и слабые ссылки» гла- 
вы 8, переменные, которые ссылаются сами на себя (или несколько ссылок, ссы- 
лающихся друг на друга косвенно), не освобождаются до выхода из программы 
(или встроенного интерпретатора). Чтобы освободить занимаемую ими память 
раньше, необходимо явно разорвать ссылку или ослабить ее с помощью модуля 
Ѕса1аг::0111 из СРАМ. 
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Другим решением может стать создание класса-контейнера, содержащего указа- 
тель на структуру данных со ссылками на саму себя. Определите метод ОЕЗТНОУ для 
класса, содержащего объект, который явно разрушит цикличность в структуре 
данных, содержащей ссылки на саму себя. Пример такого рода можно найти в гла- 
ве 18 книги «Регі: библиотека программиста» Т. Кристиансена и Н. Торкингтона 
(«Ре Соокђооҝ») в рецепте 18.18 «Как справиться с циклическими структурами 
данных» (ћіѓр://ту.ѕајагіђооЕѕопііпе.сот/0-596-00318-7/регіскьЕ2-СНР-11-5ЕСТ-15). 


Когда интерпретатор завершает работу, все его объекты уничтожаются, что важ- 
но для многопоточных приложений и встраиваемых приложений на языке Рен. 
Объекты уничтожаются в отдельном проходе, перед уничтожением обычных ссы- 
лок. Это делается, чтобы предотвратить использование методами ОЕЗТВОУ уже 
уничтоженных ссылок. (А также потому, что обычные ссылки утилизируются 
сборщиком мусора только во встроенных интерпретаторах, поскольку выход (ехіё) 
из процесса – это самый быстрый способ утилизации ссылок. Но при выходе не 
запускаются деструкторы объектов, поэтому сначала Рег! делает это.) 
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Болыпинство классов создает объекты, которые, по существу, являются просто 
структурами данных с несколькими внутренними полями (переменными экзем- 
пляра), для работы с которыми добавлены методы. 


Классы Ре] наследуют методы, а не данные, и пока доступ к объекту осуществля- 
ется только через вызовы методов, это отлично действует. Если требуется насле- 
дование данных, его нужно осуществлять через наследование методов. В целом, 
это не является необходимостью в Ре], поскольку большинство классов хранит 
данные своих объектов в анонимных хешах. Данные экземпляра объекта хра- 
нятся в этом хеше, служащем собственным маленьким пространством имен, ко: 
торое разбирают классы, когда им нужно что-то сделать с объектом. Например, 
если нужно, чтобы в объекте $с {у было поле данных с именем е1еуа{10п, можно 
просто обратиться к $сіїу->{е1еуаї1оп}. Никаких предварительных объявлений не 
требуется. Но и у методов-оберток есхь свое применение. 


Допустим, мы хотим реализовать объект Регѕоп. Мы решили создать поле данных 
«пате», которое, по странному совпадению, будет храниться с ключом папе в ано- 
нимном хеше, служащем в качестве объекта. Однако нежелательно, чтобы поль- 
зователи имели прямой доступ к данным. Чтобы пользоваться преимуществами 
инкапсуляции, для доступа к этой переменной экземпляра пользователи должны 
иметь методы, не нарушающие барьер абстракции. 


Например, можно создать пару методов доступа: 


ѕир беї папе { 
ту $ѕе1# = 5һіҒЁ, 
геёигп $ѕе1#-> {пате}; 


зиб ѕеї папе { 
пу $зе1е = Па; 
$ве1?-> {пате} = =һіРТ; 
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что ведет к написанию такого кода: 


$һт = Регзоп->пем(); 
$һіт->ѕеї_пате("Егойо”); 
$һіт->ѕеї_пате( оисҒігѕ1($һіт->де_пате) ); 


Можно даже объединить два метода в один: 


$и6 патє { 
пу $ѕе1# = ѕп1?т; 
11 (@ ) { $е1ғ-> {пате} = зһіғі } 
гефигп $ѕе1#->{пате}; 


} 
Что даст, в итоге, такой код: 


$һіт = Регзоп->пем(); 
Фһіт->пате( "Егойо”); 
$һіт->пате( оисғігѕё($һіт->пате) ); 


Преимуществом наличия отдельных функций для каждой переменной экземп- 
ляра (для нашего класса Регзоп это могут быть папе – имя, аде — возраст, һеідћі — 
рост и т.д.) являются непосредственность, очевидность и гибкость. Недостатком 
является необходимость определять в новом классе один или два почти идентич- 
ных метода для каждой переменной экземпляра. На первый взгляд, в этом нет 
ничего страшного, и никому не возбраняется выбрать тот способ, который боль- 
ше понравится. Но если удобство более важно для вас, чем гибкость, предпочти- 
тельным может оказаться один из приемов, описанных в следующих разделах. 


Обратите внимание, что мы будем изменять реализацию, а не интерфейс. Если 
пользователи вашего класса с уважением относятся к инкапсуляции, вы можете 
переходить от одной реализации к другой так, что они ничего не заметят. (Родст- 
венниқи из вашего дерева наследования, использующие ваш класс в качестве 
подкласса или надкласса, могут быть не столь покладисты, поскольку знают вас 
лучше, чем посторонние.) Если ваши пользователи совали свой нос в частные де- 
ла вашего класса, то неминуемо ожидающая их катастрофа – это их вина и не 
ваша забота. Все, что вы можете сделать, — это до конца придерживаться кон- 
тракта, сохраняя интерфейс. Попытка помешать кому бы то ни было сделать что- 
то хоть сколько-нибудь вредное отнимет все ваше время и силы - и в конце кон- 
цов все равно провалится. 


Договориться с членами семьи сложнее. Если подкласс замещает метод доступа 
к атрибуту из надкласса, должен он обращаться к тому же полю хеша или нет? 
Можно привести аргументы в пользу того и другого, в зависимости от природы ат- 
рибута. В общем случае в интересах безопасности каждый метод доступа может 
добавлять префикс с именем своего класса к имени поля, чтобы подкласс и над- 
класс имели собственные варианты поля. Некоторые из приведенных ниже приме- 
ров, а также стандартный модуль Ѕїгисї (1а5$ используют именно такую страте- 
гию защиты от подкласса. Поэтому можно встретить методы доступа вроде таких: 


ѕир пате { 
пу $зе1Р = ѕпіғі; 
пу $Ғіе1а = __РАСКАСЕ _ “: : пате”; 


і? (@ ) { $е1?->{$ғ1іе1а} = ѕһіғі } 
гефигп фѕе1#->{$іе10); 
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В каждом из последующих примеров создается простой класс Регѕоп с полями 
папе, гасе и а11азез, интерфейсы которых идентичны, но реализация совершенно 
разная. Мы не скажем, который из них нам больше нравится, потому что они все 
нам нравятся, в зависимости от ситуации. О вкусах не спорят. Кто-то любит ту- 
шеного кролика, а кто-то рыбку. 


Генерация методов доступа с помощью автозагрузки 


Как говорилось выше, при вызове несуществующего метода у Ре! есть два спосо- 
ба поиска метода АЦТОГОАВ в зависимости от того, объявлен ли метод-заглушка. 
Это свойство можно использовать для предоставления доступа к данным экземп- 
ляра без написания отдельной функции для каждого экземпляра. В подпрограм- 
ме АОТО0А0 имя фактически вызываемого метода можно извлечь из переменной 
ФАИТОГ ОАР. Рассмотрим следующий код: 


иѕе Регѕоп; 

фн1т = Регѕоп->пем; 

$һіт->пате( "Агадогг"); 

фһіт->гасе( "Мап”); 

Фһіт->а1іаѕеѕ( ["Ѕгідег”, "Еѕїте1", "Е1еѕѕаг”] ); 

ргіпі? “%5 1$ оғ? їһе гасе о? %5.\п”, $һ1т->пате, $һіт->гасе; 
ргіпі "Ніѕ а1іаѕеѕ: ‘, јоіп(", ", @{$һіт->а1лаѕеѕ}), “.\п”; 


Как и прежде, эта версия класса Регѕоп реализует структуру данных с тремя по- 
лями: папе, гасе и а11іаѕеѕ: 


раскаде Регѕоп; 
иѕе Сагр; 


пу %Ріе105 = ( 
"Регѕоп: : пате” => “уппапеа”, 
"Регѕоп: : гасе” => "ипКпомп”. 
"Регѕоп` ‘а11азез” => [], 

); 


# Следующее объявление гарантирует получение собственного автозагрузчика 
иѕе зибз дм(пате гасе а1іаѕеѕ); 


ѕир пем { 
пу $іпуосапі = ѕһі?ї, 
пу $с1аз$ = гећ?($іпуосапі) || Ф$іпуосапї; 
пу $5е1ғ = { ЖҒіе105 © } # клонировать как С1а58: :Ѕігыс+ 


р1еѕѕ $ѕе1ї, $с1азз; 
гетигп $ѕе1ғ; 


ѕиб АОТОГОАВ { 
пу $ѕе1# = ѕһіёї; 
# обрабатывать только методы экземпляра, но не класса 
сгоак "$ѕе1ғ# не является объектом” ип1езз геЁ($ѕе1#); 
ту Фпате = оиг $АЦТОГОАР; 
гефигп і? $пате =- /: : РЕЅТВОҮ$/; 
ип1езз (ехіѕїѕ $561#->{$%пате}\ { 
сгоак "Нет доступа к полю ‘$пате` в $%е1#"; 
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} 
11 (©) { геїигп $ѕе1ғ->{$папе} = зна {т } 
е1ѕе { геїигп $ѕе1#?->{$пате} } 

} 


Как видите, методов с именами папе, гасе или а11азез нигде нет. Обс всем этом за- 
ботится программа АИТОГОАО. Если кто-то использует $ћіп->пате("Агадогп”), подпро- 
грамма АЏТОІОАР получит в переменной $АУТО1ОАВ сероку с именем "Регѕоп::пате". 
То, что имя полностью квалифицировано, приводит его как раз в тот формат, ко- 
торый нужен для доступа к полям объекта. Благодаря этому в случае примене- 
ния данного класса в составе более развитой иерархии не возникает конфликт 
с такими же именами в других классах. 


Генерация методов доступа с помощью замыканий 


Большинство методов доступа делают, в сущности, одно и то же: они просто вы- 
бирают значение из переменной экземпляра или записывают его туда. В Ре! наи- 
более естественный способ создания семейства функций, почти повторяющих од- 
на другую, — определять их в цикле по замыканию. Но замыкания представляют 
собой анонимные функции, у которых нет имен, а методы должны быть имено- 
ванными подпрограммами в таблице имен пакета класса, чтобы к ним можно бы- 
ло обращаться по имени. Эта проблема решается легко: нужно присвоить ссылку 
на замыкание переменной фуреё1юЪ с нужным именем. 


раскаде Регѕоп 


ѕиб пем { 
пу $1пуосапт = 5п1?+; 
ту $зе1+ = 01е55({}, ге? $іпуосапї || $іпуосапі); 
фѕе1ғҒ->іпії(), 
гесигп $$е1ғ; 


виб іпії { 
пу $5е1ғ = ѕһіғт; 
$5е1Ғ->пате("иппатеӣ”) 
$5е1#->гғасе(“оипкпомп”) 
фѕе1#->аІіаѕеѕ([]) 


Ғог му $#зе1а (ам(пате гасе а1іаѕеѕ)) { 
ту $5101 = __ РАСКАСЕ _ “::%Ріе1а'; 
по 5Їгісї “ге”; # Так работает символическая ссылка на їуред1ор. 
*$510ї = $00{ 
пу $ѕе1# = ѕһі?і; 
$ѕе1ғ->{$Ғіе1а} = ѕһіғі 1 @ ; 
геїигп $е1#->{$ғіе1а}; 
}; 
} 


Замыкания служат самым компактным ручным способом создания группы мето- 
дов доступа к данным экземпляра. Он эффективен как для компьютера, так и для 
программиста. Методы доступа не только совместно используют один и тот же 
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код (им только нужна собственная лексическая память), но и требуют минималь- 
ных изменений, если впоследствии понадобится добавить новый атрибут: нужно 
лишь добавить еще одно слово в список цикла Гог и, возможно, что-нибудь в ме- 
тод іпії. 


Использование замыканий в закрытых объектах 


Приводившиеся до сих пор приемы управления данными экземпляров не предос- 
завляли механизма «защиты» от внешнего доступа. Находясь вне класса, каж- 
дый может открыть черный ящик объекта и залезть внутрь — если он не опасает- 
ся потери гарантии. Внедрение политики ограничений может привести к тому, 
что она станет поперек дороги тем, кто ищет пути решения стоящей перед ними 
задачи. Философия Регі состоит в том, что инкапсуляцию данных лучше произ- 
водить с помощью надписи, которая гнасит: 


В СЛУЧАЕ ПОЖАРА 
РАЗБИТЬ СТЕКЛО 


К такого рода инкапсуляции следует, по возможности, относиться с уважением, 
но, тем не менее, нужно иметь простой доступ к содержимому в аварийной ситуа- 
ции ~ например, для отладки. 


Но если вы действительно хотите обеспечить закрытость, Ре! вам мешать не на- 
мерен. Регі предоставляет низкоуровневые конструкции, позволяющие окру- 
жить класс и его объекты непроницаемым щитом — щитом более прочным, чем 
тот, который предлагают многие популярные объектно-ориентированные языки. 
Ключевыми компонентами здесь служат лексические области видимости и лек- 
сические переменные в них, а замыкания играют решающую роль. 


В разделе «Закрытые методы» мы разобрали, как использовать замыкания для 
реализации методов, которые не видны вне файла модуля. Ниже мы рассмотрим 
методы доступа, которые делают данные класса настолько закрытыми, что даже 
остальную часть класса лишают неограниченного доступа. Но все же это доста- 
точно традиционное применение замыканий. Действительно интересный подход 
состоит в том, чтобы использовать замыкание в качестве самого объекта. Пере- 
менные экземпляра объекта оказываются заперты в области видимости, свобод- 
ный доступ в которую имеет только сам объект, т.е. замыкание. Это очень силь- 
ная форма инкапсуляции: она не только защищает от вмешательства извне, но 
требует, чтобы и другие методы того же класса получали данные объекта посред- 
ством методов доступа. 


Вот пример использования этой технологии. Мы применяем замыкания как для 
самих объектов, так и для создаваемых методов доступа: 


раскаде Регѕоп; 
ѕир пем { 
ту фіпуосапі = 5ћіҒЕ 
ту $с1аѕѕ = геР($іпуосапї) || $іпуосап; 
ту Фдата = { 
МАМЕ => “иппатед”, 
ВАСЕ => “ипкпомп”, 
АСТАЗЕ$ => [], 
} 
пу $561? = зи6 { 
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пу $Рле1а = ѕпіғ+; 
НННННННННННННИНННННННЕННННИНЕН 
НЕН ЗДЕСЬ ПРОВЕРКА ДОСТУПА ### 
НЕННННЕНННННЕННННННННННННННАНЕН 
іР (@) { $аѓа->{$ғіе10} = зп } 
гефигп фдата->{$Ғіе1а}; 
}: 
б1еѕѕ($5е1?, $с1аз$); 
геїиги $зе1ғ; 
} 
# создание имен методов 
Тог ту $11е14 (ом(пате гасе а11аѕеѕ)) { 
по ѕїгісі “геғѕ”; # для доступа к таблице имен 
*$171е19 = зи6 { 
пу $зе1{ = эв1 ЕЕ; 
гећигп $ѕе1ғ->(0с $11е19, @_); 
}; 
} 
Объект, создаваемый и возвращаемый методом пем, уже не является хешем, как 
это было в конструкторах, рассмотренных нами ранее. Это замыкание с исклю- 
чительным доступом к данным атрибутов, хранящимся в хеше, на который ссы- 
лается $дата. После завершения вызова конструктора доступ к $да+а (и, следова- 
тельно, атрибутам) возможен только через замыкание. 


При обращении вида $п1п->папе("Вотраді1") вызывающий объект, хранящийся 
в $5617, является замыканием, обработанным 01655 и возвращенным конструкто- 
ром. С замыканием мало что можно сделать, кроме как вызвать его; это мы и де- 
лаем с помощью $ф561#->(ис $11е19, @ ). Пусть вас не вводит в заблуждение стрел- 
ка: это обычное косвенное обращение к функции, а не вызов метода. Первым ар- 
гументом является строка папе, а оставшиеся аргументы представляют все ос- 
тальное, что мы передали.! Когда выполнение переходит внутрь замыкания, 
ссылка на хеш внутри $аѓа снова становится доступной. После этого замыкание 
может разрешить доступ или отказать в нем по своему усмотрению. 


Никто за пределами объекта замыкания не имеет непосредственного доступа 
к этим сильно закрытым данным экземпляра, даже другие методы класса. Они 
могли бы попытаться обратиться к замыканию таким же способом, как это дела- 
ют методы, генерируемые в цикле ог, например, присваивая значение перемен- 
ной экземпляра, о которой классу ничего не известно. Но такой подход легко бло- 
кируется в участках кода конструктора, где можно найти комментарии по поводу 
проверки доступа. Прежде всего, нужна общая преамбула: 


иузе Сагр; 
1оса1 $Сагр: :Сагріеме1 = 1, # Делает сообщения сгоак короткими 
ту (Фсраск, $сғі1е) = са11ег(); 


Теперь рассмотрим каждую из проверок. Первая проверяет существование ука- 
занного имени атрибута: 


сгоак "Недопустимое поле $11е19 в объекте” 
ип1е$$ ехіѕіѕ Фдата->{$11е10}; 


1 Конечно, двойное обращение к функциям выполняется медленно, но если вам важна 
скорость, станете ли вы вообще использовать объекты? 
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Следующая проверка разрешает вызов только из того же файла: 


сагр “Непосредственный доступ из сторонних файлов запрещен” 
џип1еѕѕ $с111е ед __ ҒПЕ _; 


Следующая проверка разрешает вызов только из того же пакета: 


сагр “Непосредственный доступ запрещен стороннему пакету ${сраск} : 
ип1ез$ $сраск ед __РАСКАбЕ__; 


А эта проверка разрешает вызов только из классов, наследующих наш: 


сагр "Непосредственный доступ запрещен недружественному классу ${сраск}: : ' 
ип1ез$ $сраск->1за(__РАСКАСЕ_ ); 


Все эти проверки блокируют только доступ без посредника. Пользователи клас- 
са, которые вежливо применяют методы доступа, таких ограничений не имеют. 
Ре! дает вам возможность проявлять свою привередливость в любой мере. К сча- 
стью, привередничать мало кто хочет. 


Но иногда приходится быть разборчивыми. Разборчивость нужна тем, кто пишет 
программное обеспечение для управления полетами. Если вы хотите или обязаны 
быть одним из них и предпочитаете использовать готовый код, а не изобретать все 
самостоятельно, возьмите из СРАМ модуль Тіе::$есигеНаѕћ Дамиана Конвея (Юаті- 
ап Сопугау). В нем реализованы хеши с ограниченным доступом, поддерживаю- 
щие разборчивость на открытом, защищенном и закрытом уровнях. В нем реша: 
ются также проблемы наследования, которые мы проигнорировали в предыду- 
щем примере. Дамиан создал такжеещеболее амбициозный модуль С1а$::Сопігасї, 
который накладывает на гибкую систему объектов Рег! формальный режим раз- 
работки программного обеспечения. Список функций этого модуля выглядит, как 
перечень из учебника по разработке программногс обеспечения. написанного 
профессором информатики,! включая принудительную инкапсуляцию, статиче- 
ское наследование и проверку условия проектирования по контракту (4ез1#п-Ъу- 
сопігасі сопаіёіоп) для объектно-ориентированного Рег! наряду с декларативным 
синтаксисом определения атрибутов, методов, конструкторов и деструкторов нг 
уровне объекта и класса, а также предусловиями, постусловиями и инварианта- 
ми классов. Уф! 


Новые приемы 


Начиная с версии У5.6, в Рег! появилась возможность объявлять методы, возвра- 
щающие 1-значение. Это делается с помощью атрибута 1уаІџе подпрограмм (не 
путайте с атрибутами объектов). Эта экспериментальная возможность позволя- 
ет обращаться с методом как с чем-то, что может появиться слева от знака равен- 
ства: 


раскаде Сг1їтегғ; 


зи пем { 
пу $с1а95 = зһі?Т; 
пу $5е1ғ = { рирз => 0, @ } # Замещение значения по умолчанию. 


Попробуйте угадать, кем работает Дамиан. Между прочим, весьма рекомендуем его 
книгу «Ођјесё Огіепќеа Регі» (Мапп1т8). 
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р1еѕѕ $зе1Ё, $с1а55; 


ѕир рирѕ . мае { # Присваивание рирѕ() будет выполнено позже. 
ту $ѕе1# = эВ ЕТ; 
$$е11->{рирз}; 


раскаде та1п; 
$уагтіпі = Сгіїтег->пем(рирѕ => 4), 


$уагтіпі->рџрѕ *= 2; # Присваивание $уат тіпї->рирѕ! 
$уагтіпё->рирѕ =- $/(.)/$1$1/; # Изменение $уагтіпё->рирѕ по месту! 
ргіпі $муагтіпё->рирѕ; # Тепер у нас 88 рир. 


Это позволяет обращаться с методом $фуагпіпї->рирѕ как с переменной, в то же вре- 
мя придерживаясь инкапсуляции. См. раздел «Атрибут ІуаІџе» главы 7. 


Если вы работаете с версией Регі, поддерживающей многопоточную модель вы- 
полнения, и хотите, чтобы только один поток мог вызывать некоторый метод 
с объектом, используйте для этого атрибуты 10скеб и пеїћой: 


ѕиб рирз : 1оскед теїћоа { 


} 


Когда поток выполнения попытается вызвать метод рирз объекта, перед его вы- 
полнением Рег1 заблокирует объект, предотвращая возможность одновременного 
вызова из других потоков. См. раздел «Атрибуты методов» главы 7. 


Управление данными класса 


Мы рассмотрели несколько способов организации доступа к данным в объектах. 
Однако иногда нужно иметь некоторое состояние, общее для всех объектов клас- 
са. Такие переменные являются глобальными для всего класса, а не атрибутами 
лишь одного его экземпляра, и не зависят от того, через какой экземпляр класса 
(объект) осуществляется к ним доступ. (Программисты на С++ могут предста- 
вить их как статические члены-данные.) Вот некоторые ситуации, в которых мо- 
жет оказаться удобным использование переменных класса: 


• Ведение учета всех когда-либо созданных или действующих в данный момент 
объектов. 


• Ведение списка всех объектов, которые можно обойти в цикле. 


» Хранение имени дескриптора файла журнала, используемого методом отлад- 
ки всего класса. 


» Ведение учета общих данных, например общей суммы денег, выданных всеми 
банкоматами в сети за данные сутки. 


• Отслеживание последнего созданного классом объекта или объекта, к которо- 
му чаще всего осуществляется доступ. 


• Поддержка кэша хранимых в памяти объектов, воссозданных из постоянной 
памяти. 


• Поддержка таблицы обратного поиска объектов по значению атрибута. 
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Вопрос сводится к принятию решения о том, где хранить общие атрибуты. В Ре] 
нет специального синтаксического механизма для объявления как атрибутов 
класса, так и атрибутов экземпляра. Но Рен предоставляет разработчику набор 
мощных, но гибких функций, которые можно уникальным образом использовать 
в зависимости от конкретных условий. В результате можно выбрать механизм, 
наиболее подходящий в данной ситуации, а не полагаться на чужие архитектур- 
ные решения. С другой стороны, можно обратиться к архитектурным решениям. 
которые кто-то другой упаковал и положил в СРАМ“. Как всегда, ТМТО\УУТИТ. 


Как и во всем, что относится к классам, следует избегать непосредственного обра- 
щения к данным класса, особенно из-за пределов самого класса. Нельзя обеспе- 
чить инкапсуляцию, если после тщательной подготовки ограничивающих мето- 
дов доступа к переменным экземпляра позволить кому угодно укокошить пере- 
менные класса непосредственно, например, выполнив $50теС1а53::бефид = 1. Чтобы 
установить четкую преграду между интерфейсом и реализацией, можно создать 
методы доступа к данным класса, аналогичные тем, которые применяются для 
доступа к данным экземпляра. 


Представим, что нужно вести глобальный учет поголовья объектов Сг1 ег. Мы 
будем хранить это число в переменной пакета, но предоставим метод с именем 
рори1аїіоп, благодаря которому пользователям класса не потребуется знать ниче- 
го о механизме реализации. 


Сг1їтег->рориЈа+іоп() я Доступ через имя класса 
$9011 ит->рори1а{1оп() # Доступ через экземпляр 


Поскольку класс в Ре! является просто пакетом, естественнее всего хранить дан- 
ные класса в переменной пакета. Ниже приведена простая реализация такого 
класса. Метод рори1аїіоп игнорирует переданный инвокант и возвращает теку- 
щее значение переменной пакета, $Рори1аїіоп. (Некоторые программисты предпо- 
читают именовать глобальные переменные с заглавной буквы.) 


раскаце Сгіїтег; 
оиг $Рориаїл1оп = 0; 
ѕиб роршаїіоп { гефогп $РориТа1опт } 
зиб БЕЗТВОУ { $РориЈаїіоп - } 
ѕир зрамп { 
ту Фіпуосапї = ѕһіғт, 
ту $С1а$$ = геё($іпуосапї) || $іпуосапї; 
$Рори1а{10оп++; 
гефигп Б1еѕѕ { пате => з111* || “апоп” }, $с1аз8; 
} 
3и6 пате { 
ту $ѕе1# = ѕһіҒі; 
фѕе1?-> {пате} = ѕһіғі 1? 6@ ; 
гетигп $ѕе1#-> {папе}; 


} 


Чтобы методы данных класса работали как методы доступа к данным, следует 
делать так: 


оиг $рериддіпд = 0; # начальные данные классе 
ѕир дерид { 
ВТР; # намеренное игнорирование инвоканта 
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$0ериддіпо = ѕһігї і? Ө ; 
геёигп $0е6.991п9; 
} 


Теперь можно установить общий уровень отладки в классе или любом из его эк- 
земпляров. 


Являясь переменной пакета, $0ебиддіпо доступна глобально. Но если изменить ог 
на пу, то ее сможет видеть только последующий код в том же файле. Можно пойти 
еще дальше: отобрать неограниченный доступ к атрибутам класса даже у осталь- 
ной части самого класса. Поместите объявление переменной в область видимости 
блока: 


{ 


ту $реридд2по = 0; # данные класса с лексической областью видимости 
ѕиб дерид { 
ВТР; # намеренное игнорирование инвоканта 


$0ебидд91п9 = ЗВАЕЕ 1 @; 
геёигп $0е6и991п9; 


} 


Теперь никто не сможет читать или записывать атрибуты класса без использова- 
ния метода доступа, так как только его подпрограмма находится в той же облас- 
ти видимости, что и переменная, и имеет к ней доступ. 


В производном классе, унаследовавшем методы доступа к данным класса, они по- 
прежнему будут обращаться к исходным данным независимо от того, определя- 
лись ли переменные с помощью оџг или пу. Данные не зависят от пакета. Можно 
рассматривать это как выполнение методов в классе, где они были определены, 
а не в классе, вызвавшем их. 


Для одних типов классов такой подход работает, а для других ~ нет. Допустим, 
мы создаем подкласс Маго! класса Сгіїїег. Если потребуется вести отдельный учет 
поголовья варгов, класс Магд не должен будет наследовать метод рори1аї1оп класса 
Сгіїтег, поскольку этот метод, как мы его написали, всегда возвращает значение 
$Сг тег: :Рори1ат1оп. 


Необходимо решать в каждом конкретном случае отдельно, имеет ли смысл атри- 
бутам класса зависеть от пакета. Если нужны атрибуты, зависящие от пакета, 
используйте класс инвоканта для поиска пакета с данными класса: 


зиб дерид { 
ту $1пуосапт = $п111; 
пу $с1а55 = ге?($іпуосапі) || $іпуосапї; 
ту $Уагпате = $с1аз$ . “ :рериддіпс“; 
по зфг1ст "ге#ѕ”; # для доступа к данным пакета через таблицу имен 


$$уагпапе = ѕһі?т 1? @ ; 
гетигп $$уагпате; 


} 


Мы временно отменяем ограничение на ссылки, потому что иначе не смогли бы 
использовать полностью квалифицированное символическое имя для глобальной 
переменной пакета. Это совершенно обоснованно: поскольку, по определению. все 


* Варг, мифологическое существо – огромный волк. – Прим. перев. 


Лось в посудной лавке (Мооѕе) 443 


переменные пакета располагаются в пакете, нет ничего плохого в обращении 
к ним через таблицу имен этого пакета. 


Другой подход состоит в том, чтобы сделать все данные, необходимые объекту, — 
даже глобальные данные класса – доступными через этот объекгг (или передавать 
в качестве параметров). С этой целью часто приходится создавать специальный 
конструктор для каждого класса или, пс крайней мере, специальную процедуру 
инициализации, вызываемую конструктором. Конструктор или процедура ини- 
циализации записывают ссылки на любые данные класса непосредственно в сам 
объект, поэтому в будущем их не придется искать. Методы доступа берут ссылки 
на данные из объекта. 


Каждый метод не ведет сложный поиск данных класса; вместо этого объект сооб- 
щает методу, где эти данные находятся. Этот подход хорошо работает, только ес- 
ли методы доступа к данным класса вызываются как методы экземпляра, потому 
что данные класса могут храниться в недоступных лексических переменных. до 
которых нельзя добраться с помощью имени пакета. 


Как ни крути, а данные класса, зависящие от пакета, всегда несколько опасны. 
Значительно надежнее, если при наследовании методг доступа к данным класса 
наследуются и данные состояния, с которыми он работает. Многочисленные и бо- 
лее проработанные подходы к управлению данными класса можно найти на стра- 
нице руководства регіїѓоої. Однако вам придется поблуждать в них. 


Лось в посудной лавке (Моозе) 


Выше рассказывалось о встроенной объектной системе Рег], но существует дру- 
гая объектная система, которая нравится программистам на Рег. Применяя 
приемы метаобъектного программирования, модуль Мооѕе предоставляет множе- 
ство интересных возможностей. Модуль Моозе обладает намного более широкими 
возможностями, чем можно охватить в этой книге (и в действительности заслу- 
живает отдельной книги), но чтобы дать некоторое представление: 


и$е м5. 14; 


раскаде Зфаб1ез 1.01 { 
изе Моозе, 


паз "ап1та18“ => ( 
{га {$ => ["Аггау”], 


15 => “тм”, 

іѕа => “АггауВе?[Апіта1]”, 
деѓғаџ1ї => зи6 { [] }, 
һапд1еѕ => { 


ада апітаї => "риѕћһ”, 
айа апіта1ѕ => "риѕћ”, 


зиб го11 са11 { 
ту($561#) = @ ; 


Тог ту $апіта1 ($5е1ғ->апіта15ѕ) { 
ѕау "Зоте “, фапіта1->+уре, 
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“ памед `, Фап1лта1->папе, 
"13 іп їһе эта е”; 


раскаде Апіта1 1.01 { 
иѕе Мооѕе; 


Каз “пате” => ( 
15 => “ги”, 
1за => “їг”, 
гедиігеб => 1 


Ваз "уре" => ( 
13 => “гм”, 
15а => “бұг”, 
деРаи1{ => “апіша1", 


} 
ту $ѕёар1еѕ = 5+ар1еѕ->пем, 


$5ѕгаб1еѕ->адд апіта1( 
Апіта1->пем(пате => “Мг. Еа" туре => "һогѕе") 


); 


$5їар1е5->ада _апіта15( 
Апіта1->пем(пате => "Оопкеу", уре => "допкеу”), 
Апіта1->пем( пате "Сатрміск”, +уре => “допкеу”), 
Апіта1->пем(пате => "Тгіддег", туре => “һогѕе” ), 


Ш 
м 


); 
ф5Таб1е5->го11 са11; 


Модуль Мооѕе может существенно упростить жизнь разработчику классов. Мо- 
дуль Мо0ѕе из пакета 5їаб1еѕ предоставляет возможности, которые утомительно 
было бы реализовывать вручную. Вызов һаѕ определяет методы доступа с указан- 
ными свойствами. 


конструктор по умолчанию с аргументами по умолчанию 


В пакетах Ѕїаб1еѕ и Апіпа! нет явного конструктора. Модуль Мооѕе заботится 
обо всем этом автоматически. Если потребуется что-то особенное, всегда мож- 
но определить свой конструктор. Атрибут папе в классе Апіпа1 является обяза- 
тельным, а атрибут туре имеет значение по умолчанию. 
проверка параметров 

В пакете За ]ез в строке һаѕ апіта15 тип значения объявляется как массив 
ссылок Аггауће?, содержащий объекты Ап1та1. Ключ деѓаџії определяет, что де- 
лать, если конструктор вызван без аргументов (поскольку геди1гед равно 0). 
Модуль Мооѕе проверит, является ли значение, переданное методу а09_ап1та1з, 
объектом Апіпа1. 
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характеристики (їтаіїіѕ) 


Ключ їгаіїѕ определяет поведение метода доступа. Поскольку его значением 
является ссылка на массив, вам, вероятно, понадобится применять к нему 
операции, используемые при работе с массивами. Ссылка на хеш һапӣ1еѕ ото- 
бражает имена, которые вы сможете использовать как имена методов. Методы 
ада апіта1 и ада апіта15 соответствуют методу ризй массива Аггау. 


Это всего лишь простой пример. Модуль Моозе обладает намного более широкими 
возможностями. Поближе познакомиться с ним можно на веб-сайте ##р://тоозе. 
регі.огЕ. 


Существуют и другие модули, реализующие подобные интерфейсы. Каркас Моизе 
представляет собой урезанную версию Мооѕе и призван смягчить проблемы про- 
изводительности за счет исключения некоторых редкоиспользуемых особенно- 
стей. Моо — еще одна урезанная версия Моозе, без поддержки ХЅ-реквизитов, упро- 
щающая развертывание. А каркас Мо еще меньше. 


Резюме 


Вот и все, что можно тут рассказать, за исключением всего прочего. Вам остается 
лишь пойти и купить книгу по методам объектно-ориентированного проектиро- 
вания и биться об нее лбом ближайшие полгода или около того. 


15 


Перегрузка 


Объекты, конечно, хороши, но иногда они слишком хороши. Иногда хочется, что- 
бы их поведение больше походило на поведение обычных типов данных. Но на 
этом пути есть проблема: объекты представляются ссылками, а возможности ра- 
боты со ссылками невелики: ссылки нельзя складывать, выводить или (с какой- 
нибудь пользой) применять к ним многие встроенные операторы Рег]. По сути, их 
можно только разыменовывать. Вот и приходится то и дело писать вызовы мето- 
дов, например: 


ргіп $објесї->аѕ_ѕЕгіпо; 
$пем_орјесе = $5џибјесї->адд($објесї); 


Такое явное разыменование, вообще говоря, дело полезное, так как при этом не 
спутаешь ссылки с их объектами, кроме как в случаях, когда путаница создается 
намеренно. Один из таких случаев мы сейчас и рассмотрим. Если при разработке 
класса использовался прием перегрузки (ооегіоайіпв), можно сделать вид, что ни- 
каких ссылок нет, и просто сказать: 


ргіпі форјесї; 
Фпем_објесї = $ѕирјесї + $орјесї; 


При перегрузке встроенного оператора Рей вы определяете, как он должен себя 
вести, будучи применен к объектам определенного класса. Перегрузка применя- 
ется в ряде стандартных модулей Рец, например Маїћ::ВіоІпї. Последний позволя- 
ет создавать объекты Маїћ::ВідІпі, ведущие себя как обычные целые числа, но 
имеющие неограниченный размер. Их можно складывать оператором +, делить 
оператором /, сравнивать оператором <=> и выводить функцией ргіпї. 


Обратите внимание, что перегрузка (оуеоа 11) — это совсем не то же самое, что 
автозагрузка (аџѓоІіоайіпе), которая означает загрузку отсутствующих функций 
или методов по требованию. И перегрузка — совсем не то же самое, что замещение 
(оУегт1А115), при котором одна функция или метод маскируют другую функцию. 
Перегрузка ничего не скрывает; благодаря ей бессмысленная до того операция 
над ссылкой приобретает смысл. 


Прагма омецоаа 447 


Прагма оуейоаа 


Прагма о\е! 10ад осуществляет перегрузку операторов. Ей передается список пар 
ключ/значение, состоящий из операторов и связанных с ними действий: 


раскаде МуС1азз: 


изе омег1оад +” => \&туада, # ссылка на код 
“<” = “1ез5 Нап”, я именованный метод 
“аб$” => ѕир { гетигп @ }; # анонимная подпрограмма 


Если теперь попытаться сложить два объекта МуС1аз5, для формирования резуль- 
тата будет вызвана подпрограмма пуабй. 


Если попытаться сравнить два объекта Му(1а55 с помощью оператора <, Рег обна- 
ружит, что нужное действие определяется строкой и будет интерпретировать эту 
строку как имя метода, а не просто подпрограммы. В приведенном примере метод 
1езз_{Вап может быть предоставлен самим пакетом МуС1а5 или унаследован клас- 
сом МуС1а$$ от базового класса, а вот подпрограмма пуа04 должна быть предостав- 
лена текущим пакетом. Анонимная подпрограмма для абѕ предоставляется еще 
более непосредственным способом. Каким бы образом ни предоставлялись эти 
программы, будем называть их обработчиками (Вап{егз). 


Для унарных операторов (т.е. принимающих единственный аргумент, как абѕ) 
указанный для класса обработчик вызывается всякий раз, когда оператор приме- 
няется к объекту этого класса. 

Для бинарных операторов, таких как + или <, обработчик вызывается, если первый 
операнд является объектом класса или если второй операнд является объектом 
класса, а для первого операнда перегрузка не определена. Поэтому можно сказать: 


$орјесї + 6 
или: 
6 + $објесї 


не беспокоясь о порядке операндов. (Во втором случае операнды при передаче об- 
работчику поменяются местами.) Для выражения 


фап1та1 + $уедета Ле 


фап1та1 (животное) и $уедеїар1е (овощ) являются объектами разных классов, в каж- 
дом из которых определен перегруженный оператор +, и для выполнения опера- 
ции будет использована перегрузка $ап1 та]. (Будем надеяться, что животному по- 
нравятся овощи.) 


В Рен есть только один тернарный («тринарный») оператор, ?:, и перегрузить его 
нельзя. К, счастью. 


Обработчики перегрузки 


При выполнении перегруженного оператора соответствующему обработчику пе- 
редается три аргумента. Первые два — операнды. Если оператор использует толь- 
ко один аргумент, то вторым аргументом является ипдеї. 
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Третий аргумент указывает — допускается ли перестановка первых двух аргу- 
ментов. Даже по правилам обычной арифметики некоторые операции, например 
сложение и умножение, безразличны к порядку своих аргументов, а другие, на- 
пример вычитание и деление, нет.! Взгляните на разницу между: 


$орјесї - 6 


6 - Форјесї 


Если первые два аргумента обработчика могут меняться местами, то третий име- 
ет истинное значение. Иначе третий аргумент будет иметь ложное значение, 
и в этом случае есть также более тонкое различие: если обработчик вызван дру- 
гим обработчиком оператора с присваиванием (как для +=, где положение знака + 
определяет порядок сложения), то третий аргумент не просто имеет ложное зна- 
чение, но ипдет. Это различие позволяет выполнить некоторую оптимизацию. 


В качестве примера приведем класс, позволяющий работать с ограниченным диа- 
пазоном чисел. В нем + и - перегружаются так, что результат сложения или вычи- 
тания ограничивается, чтобы попасть в диапазон от 0 дс 255: 


раскаде С11рВу{е; 


изе оуег1оад ”+” => \&511р_а99, 


= => \&611р_$и6; 


ѕиб пем { 
пу $с1а55 = ѕһіЁЕ; 
пу $уа1џе = $111; 
гетигп 01е55 \$уа10џе => $с1а55; 


в 


зи с1ір аду { 
ту ($х, $у) =@; 
ту ($уа1ие) = ге#($х) ? $х $х: 
$уа1ие += ге! ($у) ? $$у . $,. 
фуа1ие = 255 11 $фуа1ие > 255 
$уаше = 011 $уаше < 0; 
гефигп Б1еѕѕ \$уа1ие => ге?($х) 


$46 с11р_$и6 { 
ту ($х, Фу, $ѕмар) = @_; 
ту ($уа1џе) = (ге? $х) ? $$х $х 
$\а1ие -= (ге? Фу) ? $$у : $у; 
11 ($5мар) { $уа1ие = -$уа1ие } 
$уа1ие = 255 1{ $маше > 255 
фуа1ие = С 1іғ $уаше < 0; 
гефигп Б1езз \Фуа1ие => ге!($х): 


Перегружаемые объекты не обязаны придерживаться правил обычной арифметики, 
но вообще лучше не вызывать у людей удивление. Странно, но многие языки соверша- 
ют ошибку, перегружая + операцией конкатенации строк, что не только не коммута- 
тивно, но даже аддитивно с натяжкой. В Рег: вы найдете другой подход. 
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раскаде таіп; 


Фоуте1 = С11ірВуїе->пем(200); 
фруте2 = С1арВуфе->пем(100); 
$Бутез = $буїе1 + $0уте2; # 255 
$Буте4 = $0уїеї - $6уте2; в 100 


$Бутеб5 = 150 - $руїе2: #50 


Обратите внимание, что все функции здесь по необходимости являются конст- 
рукторами, поэтому каждая из них использует 01685 для связывания ссылки на 
свой новый объект с текущим классом, чем бы он ни был; мы предполагаем, что 
наш новый класс может наследоваться. Мы также предполагаем, что если $у яв- 
ляется ссылкой, то это ссылка на объект созданного нами типа. Вместо проверки 
ге!($у) мы могли бы вызывать $у->іѕа("С1ірВуїе' ), чтобы быть абсолютно точными 
(но эта проверка выполнялась бы медленнее). 


Перегружаемые операторы 


Перегружать можно только определенные операторы (табл. 13.1), а также в хеше 
Жоуег10аа::0рѕ, который становится доступен в области действия директивы изе 
оуег1оаа, хотя разбивка по категориям в нем несколько иная. 


Таблица 13.1. Перегружаемые операторы 


Категория Операторы 


Преобразование "7 0+ 6001 аг 


Арифметические +-* /фжх пед 
Логические 
Поразрядные & 1-71 <>» 
Присваивания += -= += /= ҖЕ к= дЕ = <<= >= ++ -- 
Сравнения == < <= > >= != <=> Ц 16е 91 де ед пе стр 
Математические агап2 соѕ $1п ехр абѕ 109 ѕдгі іпї 
<> 

-Х 

${} 6} 90) 64} *{} 


Итеративные 
Проверка файлов 
Разыменования 


Сопоставления 


Псевдо попеїћод Ра11баск = 


Обратите внимание, что пед, 0001, попеїћой и Ға11баск фактически не являются опе- 
раторами Рег1. Пять разыменовывающих операторов, дг, `` и 0+ тоже не похожи на 
операторы. Тем не менее, все они могут выступать как ключи в списке параметров 
директивы изе омег1оад. На самом деле, это не представляет проблемы. Откроем 
маленький секрет: мы слегка мошенничаем, говоря, что прагма омег1оад перегру- 
жает операторы. Она перегружает производимые операции, когда вызывается явно 
через «официальные» операторы или неявно через какой-либо связанный опера- 
тор. (Упомянутые псевдооператоры могут вызываться только неявно.) Иными сло- 
вами, перегрузка производится не на синтаксическом уровне, а на семантическом. 
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Цель не в том, чтобы хорошо выглядеть, а в том, чтобы делать то, что нужно. Обоб- 
щить можете сами. 


Заметьте также, что = не перегружает оператор присваивания, как можно было 
бы предположить. Это было бы неправильно. Подробнее об этом ниже. 


Начнем с обсуждения операторов преобразования -— не потому, что они самые оче- 
видные (это не так), а потому что они самые полезные. Многие классы перегружа- 
ют только преобразование в строку, задаваемое ключом “"", и больше ничего. (Да, 
это действительно две двойных кавычки подряд.) 


Операторы преобразования: “", 0+, 0001, дг. 


Первые три ключа позволяют задать режимы автоматического преобразова- 
ния в строки, числа и логические значения соответственно. 


Четвертый ключ используется, когда объект интерполируется или использу- 
ется как регулярное выражение, включая ситуации, когда объект играет роль 
правого операнда операторов =- и !-. Подпрограмма дг должна возвращать 
скомпилированное регулярное выражение или ссылку на скомпилированное 
регулярное выражение, как делает настоящая подпрограмма дг, а любые даль- 
нейшие перегрузки в возвращаемом значении будут игнорироваться. 


Мы говорим, что происходит преобразование в строку (ѕігіпаіјісаѓіоп), если 
нестроковая переменная используется в качестве строки. Это происходит, ко- 
гда переменная преобразуется в строку при выводе, интерполяции, конкате- 
нации и даже при использовании в качестве ключа хеша. Преобразование 
также служит причиной появления чего-то вроде ЗСА-АН(Охра5Ре0) при попыт- 
ке вывести объект. 


Мы говорим, что происходит преобразование в число (пипийсаноп), когда не- 
числовая переменная преобразуется в число в каком-либо числовом контек- 
сте, например в математическом выражении, индексе массива или даже опе- 
раторе диапазона (..). 


Наконец, хотя никто не посмеет назвать это бооййсаНоп, но можно опреде- 
лить способ интерпретации объекта в логическом контексте (таком, как 11, 
ий]е$$, мћ11е, Гог, апа, ог, &&, ||, ?: или блок выражения дгер) путем создания ло- 
гического обработчика. 


Любые из этих трех операторов преобразования могут самогенерироваться, 
если имеется один из них (что такое самогенерация, мы разъясним позже). Об- 
работчики могут возвращать любые значения. Отметьте, что если операция, 
запустившая преобразование, тоже перегружена, ее перегрузка происходит 
сразу после преобразования. 


Вот пример перегруженного оператора , который запускает обработчик 
аѕз_ѕігіпо объекта при преобразовании в строку. Не забывайте заключать в ка- 
вычки сами кавычки: 


раскаде Регзоп; 
иѕе омег10оай 9(“”) => \8аз_$%г1п9; 


зиб пем { 
му $с1аз$ = зН1РЕ; 
геїцгп 61е5з { @ } => $с1а58; 
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396 аѕ_ѕігіпо { 
ту $5е1ғ = зһіғТ; 
ту ($Кеу, $уа1ие, $геѕи?ї); 
мһі1е ((ФКкеу, Ф$уг10е) = еасһ %$5е1#) { 
$геѕи1ї .= "$кеу => $иаше\п"; 
} 
гефигп $геѕџи1+; 
} 


$06) = Регѕоп->пем(һеіоһі => 72, меідһї => 165, еуеѕ => темно-карие“) 
ргіпі $051; 
Вместо чего-то вроде Регѕоп=НАЅН(0х0а1350), этот код выведет (в порядке хеша): 


меідһі => 165 
һеідһїі => 72 
еуеѕ => темно-карие 


(Искренне надеемся, что вес и рост этого человека выражаются не в килограм- 
мах и сантиметрах.) 


Арифметические операторы: +, -, =, /,%, **, х, ., пед 


Все они должны быть вам знакомы, за исключением пед, который является 
специальным ключом перегрузки унарного минуса: знака - в -123. Различие 
между ключами пед и - позволяет назначить различное поведение унарному 
минусу и бинарному минусу, обычно называемому вычитанием. 


Если вы перегружаете -, но не пед, а затем пытаетесь использовать унарный 
минус, Рег эмулирует для вас обработчик пед. Это называется самогенерацией 
(ашювепеганоп); при этом некоторые операторы можно разумным образом вы- 
вести из других (в допущении, что перегруженные операторы будут иметь та- 
кие же связи, как у обычных операторов.) Так как унарный минус можно вы- 
разить как функцию бинарного минусе (т.е. -123 эквивалентно 0 - 123), Ре! не 
заставляет перегружать пед, поскольку можно обойтись -. (Конечно, если вы 
определили, что бинарный минус делит второй аргумент на первый, унарный 
минус станет отличным способом возбуждения исключительной ситуации де- 
ления на ноль.) 


Конкатенация через оператор . может самогенерироваться через обработчик 
преобразования в строку (смотри описание “" выше). 


Логический оператор: ! 


Если обработчик для ! не задан, он может самогенерироваться с помощью об- 
работчиков 0001, `` или 0+. Если вы перегружаете оператор !, оператор пої тоже 
будет демонстрировать заданное вами поведение. (Помните наш маленький 
секрет?) 

Вас может удивить отсутствие других логических операторов, но большинст- 
во логических операторов не могут перегружаться, потому что они вычисля- 
ются по короткой схеме. Являясь, в действительности, операторами управле- 
ния порядком выполнения инструкций, они должны иметь возможность от- 
кладывать вычисление некоторых своих аргументов. Это также служит при- 
чиной того, что оператор 7: не перегружается. 
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Поразрядные операторы: 8, |, -, °, <<, >> 


Оператор - является унарным, а все остальные – бинарными. Вот как можно 
перегрузить >> для реализации чего-то вроде спор: 


раскаде 5һіҒЕЅ1гіпо; 


изе омег1оаа 
">>" => \&г19 Пе ҺР, 
9(“") => ѕир { 9 $_[0] } }; 


ѕиб пем { 
пу $с1аз$ = $һіҒЇ, 
пу $уа1ие = зна; 
гетигп 61езз \Фуа1ие => $с1а5$; 


зию гідћі_ћіТЕ { 

пу ($х, $у) = @; 

ту $уа1ие = $$х; 

ѕирѕїг($уа1ие, -$у) = `"; 

гетигп 61ез5 \$уа1ие => ге?($х): 
} 


фсате1 = 5111451 г1пд->пем( “Сапе "); 
$гат = $сате1 >> 2; 
ритпЕ $гап; # Сат 


Операторы присваивания: +=, -=, +=, /=, №=, **=, х=, .=, <<=, >=, ++, -- 

Эти операторы присваивания могут изменять значения своих аргументов или 
оставлять их как есть. Результат присваивается левому операнду, только если 
новое значение отличается от старого. Благодаря этому один и тот же обработ- 
чик может использоваться для перегрузки как +=, так и +. Это допустимо, но 
редко рекомендуется, поскольку согласно семантике, описываемой далее в раз- 
деле «Когда отсутствует обработчик перегрузки (потеіћоа и ѓаПБасКк)», Рей 
в любом случае вызовет обработчик для +, предполагая что += не перегружен 
непосредственно. 


Конкатенация (.=) может самогенерироваться с использованием преобразова- 
ния в строку, за которым следует обычная конкатенапия строк. Операторы ++ 
и -- могут самогенерироваться из т и - (или += и -=). 

Предполагается, что аргументы в обработчиках ++ и -- мутируют (изменяют- 
ся). В обработчике можно сделать так, чтобы автодекрементирование работа- 
ло как с буквами, так и с числами: 


раскаде Мад1с0ес; 


изе омег1оай 
9(--) => \&десгемепт, 
9077) => вир { $ $[0] } }; 


зир пем { 
ту Фс1а$5 = 5һіЁҰ; 
пу $ма1џе = 5һіғї; 
р1еѕѕ \$уа1џе => $с1а55; 
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ѕир десгетепт { 
пу @ѕїгіпо = гемегѕе ѕр111(//, $4 $ [0] } ) 
пу $1; 
Рог ($1 = 0; $1 < @ѕїгіпо; $14+ ) { 
1аѕї ип1езз $51гіпо[$1] =- /а/і 
$51гіпо[$%11 = сһг( огд($$г119[$1]) + 25 ); 
) 
$5Ег1п9[$1] = сһг{ ог9($$г119[$11) - 1 ); 
пу $геѕи1ї = јоіп(”" => гемегзе @ѕїігіпо); 
$ [0] = 01е55 \$гези1{ => ге?(% [0]); 
} 


раскаде таіп; 


Рог фпогта1 (ди/рег1 № Ра/) { 
$иад1е = Мадісрес->пем($погша1); 
фтадіс--; 
ргіпі "Фпогта1 стал Ф$тадіс\п”: 


} 
Этот код выведет: 


рег1 стал регк 
№ стал № 
Ра стал 07 


Это точная противоположность встроенного в Рег! волшебного оператора авто- 
инкрементирования строки. 


Операция ++$а может самогенерироваться с использованием $а += 1 или $а = $а + 1, 
а $а-- – с использованием $а -= 1 или Фа = $а - 1. Однако при этом нет поведения 
копирования, которое демонстрирует настоящий оператор ++. См. раздел «Кон- 
структор копирования» далее в этой главе. 


Операторы сравнения: ==, <, <=, >, >=, |=, <=>, Ц, 1е, 9%, де, ед, пе, стр 


Если оператор <=> перегружен, он может применяться для самогенерации по- 
ведения операторов <, <=, >, >=, == и !=, Аналогично, если перегружается спр, он 
может использоваться для самогенерации поведения 1ї, ]е, 01, де, еди пе. 


Обратите внимание, что перегрузка стр не позволяет так легко, как хотелось 
бы, сортировать объекты, поскольку сравниваться будут не сами объекты, 
а их строковые версии. Чтобы это сделать, потребуется также перегрузить "". 


Математические функции: атап2, соѕ, 51п, ехр, арѕ, 109, загт, 111 


Если функция арѕ недоступна, она может самогенерироваться из < или <=> в со- 
четании с унарным минусом или вычитанием. 


Перегруженный · (минус) может применяться для самогенерации отсутствую- 
щих обработчиков унарного минуса или функции абз, которая может перегру- 
жаться отдельно. (Да, мы знаем, что абѕ напоминает функцию. а унарный ми- 
нус напоминает оператор, но в Рег! они не настолько различаются.) 


Исторически сложилось так, что функция іпї выполняет округление в сторо- 
ну 0 (см. описание 111 в главе 27), поэтому для объектов, действующих подобно 
вещественным типам, она должна делать то же самое, чтобы не вызывать не- 
доумение пользователей таких объектов. 
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Итеративный оператор: <> 


Обработчик <> может запускаться путем использования геай1іпе (при чтении 
из дескриптора файла, как в мћі1е (<ЕН>)) или 9106 (при поиске файлов по шаб- 
лону, как в @Г116е$ = < +>). 


раскаде іискургам, 


иѕе оуег1оад 
"<>" => ур { 
ту $ѕе1# = ѕһ1ғ+; 
гетигп $р11се @$%561ғ, гапа @$зе1 1; 
}; 


ѕиб пем { 

пу $с1а$$ = ЗИ, 

гефигп 61е5$ [@_] => $с1а55; 
} 


раскаде тмазп; 
$100 = пем Гискургам 1 51; 


Ғог (9м(1-й 2-й 3-й 4-й 5-й 6-й)) { 
$10ску питрег = <$10110>; 
ргіпі "$_ счастливый номер: $1иску_питоег. \п"; 


} 


$] иску питрег = <$10їТ0>; 
ргіпі “\пИ дополнительный номер: $1иску_питбег.\п”; 


В Калифорнии! этот код выведет: 


1-й счастливый номер: 18 
2-й счастливый номер: 11 
3-й счастливый номер: 40 
4-й счастливый номер: 7 
5-й счастливый номер: 51 
6-й счастливый номер: 33 


И дополнительный номер: 5 


Операторы проверки файлов 


Ключ -Х используется для определения подпрограммы, обрабатывающей все 
операторы проверки файлов, такие как -Г, -х и т.д. См. табл. 3.4 в разделе 
«Именованные унарные операторы и операторы проверки файлов» главы 3. 


Нельзя выполнить перегрузку операторов проверки файлов выборочно. Чтобы 
различать их, во втором аргументе передается буква, следующая после знака 
«-» (т.е. в позиции, где бинарные операторы получают второй операнд). 


Вызов перегруженного оператора проверки файлов не влияет на значение ѕїаї, 
связанное со специальным дескриптором файла _. Оно по-прежнему будет 
ссылаться на результат последнего вызова тат, 15їаї или выполнения непере- 
груженного оператора проверки файлов. 


1 Речь идет о лотерее САТЛЕОВМТА БОРЕВГОТТО. – Прим. ред. 
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Перегрузка этих операторов стала возможной, начиная с версии у5.12. 
Операторы разыменования: $], 6{}, %{}, &{}, +0} 


Попытки разыменования ссылок на скаляры, массивы, хеши, подпрограммы 
и 2106 могут перехватываться путем перегрузки этих пяти символов. 


В электронной документации по директиве охег1оай показано, как с помощью 
этого оператора моделировать собственные псевдохеши. Вот более простой 
пример, реализующий объект как анонимный массив, но позволяющий ссы- 
латься на него, как на хеш. Не пытайтесь обращаться с ним как с настоящим 
хешем; вы не сможете удалять из объекта пары ключ/значение посредством 
де]ете. Чтобы соединить обозначения массивг и хеша, используйте настоящий 
псевдохеш. 


раскаде РѕусһоНаѕпћ, 
изе омег1оаа “%{}” => \8аз_вазп; 


346 аз_пазп { 
ту ($х) = 5ћЇҒТ; 
гефигп { @$х }; 
} 


зир пем { 

пу $с1а85 = ЅћіҒҮ, 

гесигп 61ез$ [ @ ] => $с1а5; 
} 


$сгіїтег = пем РѕусһоНаѕћ( һеідһї => 72, меідһї => 365, Туре => “саме!” ); 


ргіпі $сгіїтег->{меідһі}; # выведет 365 


См. также главу 14, где описывается механизм, позволяющий переопределять 
базовые операпии над хешами, массивами и скалярами. 


При перегрузке оператора постарайтесь не создавать объекты со ссылками на 
самих себя. Например: 


изе оуегіоаа “+” => ѕир { Б1еѕѕ [ \% [0], \% [1] 1 }; 


Это провоцирует неприятности, поскольку если сказать $ап1та1 += $уедетаб1е, 
то в результате $апіта1 станет ссылкой на превращенный в объект массив, пер- 
вым элементом которого является $ап1та1. Это пример циклической ссылки 
(сігсиаг герегепсе), которая ведет к тому, что даже при уничтожении $апіпа1 
занимаемая ею память не будет освобождена, пока не завершит работу ваш 
процесс (или интерпретатор). См. раздел «Сборка мусора, циклические и сла- 
бые ссылки» в главе 8. 


Интеллектуальное сопоставление 
Ключ -- позволяет перегрузить логику интеллектуального сопоставления, ис- 
пользуемую оператором -- и конструкцией дімеп. См. раздел «Оператор интел- 
лектуального сопоставления» в главе З и «Оператор сіуеп» в главе 4. 
Перегруженная реализация оператора интеллектуального сопоставления не 


получает полный контроль над поведением механизма интеллектуального со- 
поставления, что не совсем обычно. В частности, в коде 
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раскаде Роо, 
изе омег1оаа ”--” => "таїсћ”; 


ту $06} = Ғоо->пем(); 
$061 -- [ 1,2,3 1; 


оператор интеллектуального сопоставления не произведет вызов: 
$обј->таїсһ([1.2,3].0): # НЕВЕРНЫЙ ВЫЗОВ 


Вместо этого Рей учтет приоритет операторов и будет поочередно сопостав- 
лять $00] с каждым элементом массива в отдельности, пока не найдет соответ- 
ствие. То есть, будет произведено три вызова метода: 


$о0ј->таїсһ(1_ 0); 
$о0ј->тассһ(2,0); 
форј->таїсћ(3, 0); 


Подробности о том, когда вызывается перегруженная версия оператора интел- 
лектуального сопоставления, приводятся в табл. 8.7 главы 3. 


Конструктор копирования (=) 


Несмотря на сходство с обычным оператором, = имеет особое и не вполне интуи- 
тивно понятное значение ключа перегрузки. Он не перегружает оператор присваи- 
вания. Он в принципе не может этого сделать, поскольку оператор присваивания 
должен быть зарезервирован для присваивания ссылкам, иначе все рухнет. 


Обработчик для = используется в ситуациях, когда мутатор (тлфафог) (например, 
++, —- или любой из операторов присваивания) применяется к ссылке, использую- 
щей свой объект совместно с другой ссылкой. Обработчик = позволяет програм- 
мисту перехватить мутатор и самостоятельно скопировать объект, чтобы была 
изменена только копия. В противном случае будет изменен оригинал. 


$сору = $0г191па1; # копирует только ссылку 
++$сору. # изменит объект. общий для двух ссылок 


Теперь будьте к нам снисходительны. Предположим, что $огідіпа: представляет 
собой ссылку на объект. Чтобы заставить ++$сору модифицировать только $сору, 
а не $огідіпа1, сначала делается копия $сору, и переменной $сору присваивается 
ссылка на этот новый объект. Эта операция осуществляется, только когда выпол- 
няется ++$сору, поэтому $сору совпадает с $0гідіпа1 до инкрементирования - но не 
после него. Иными словами, оператор ++ распознает необходимость копирования 
и обращается к конструктору копий. 

Необходимость копирования распознают только мутаторы, такие как ++ или +=, 
либо попеїћой, который описывается ниже. Если операция самогенерируется по- 
средством +, как в: 


фсору = $0г191па]; 
фсору = $сору + 1: 


то копирование не производится, потому что + не знает, что используется как му- 
татор. 
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Если во время выполнения некоторого мутатора потребуется вызвать конструк- 
тор копирования, но обработчик для = не задан, он может самогенерироваться 
как копирование строки, при условии что объект является обычным скаляром, 
а не чем-то более замысловатым. 


Например, код, фактически выполняемый в этом случае: 


$сору = $0г191па1; 
++$сору, 


может выглядеть примерно так: 


$сору = $ог101па1; 


$сору = $сору->с1опе( ипаег, “””); 
$сору->іпсг(ипдеғҒ, “"); 


При этом предполагается, что $0г101па1 указывает на перегруженный объект, ++ 
был перегружен на \&іпсг, а = перегружен на \&с1опе. 


Аналогичные действия запускаются при выполнении $сору = $огідіпа1++, что ин- 
терпретируется как $сору = $0г191па1; ++фогідіпа1. 


Когда обработчик перегрузки 
отсутствует (потеќћоа и #аПбаск) 


Когда к объекту применяется не перегруженный оператор, Рег! сначала пытается 
самогенерировать его поведение из других перегруженных операторов с помо- 
щью описанных выше правил. В случае неудачи Рег| ищет реализацию перегруз- 
ки для попе{под, и, если она существует, использует ее. Этот обработчик является 
для операторов тем же, чем подпрограмма АТО: 0А) для подпрограмм: это то, что 
вы делаете, когда ничего другого придумать не можете. 


Если использован ключ попе{посв, за ним должна следовать ссылка на обработчик, 
принимающий четыре аргумента (а не три, как для всех остальных обработчиков). 
Первые три аргумента — такие же, как для любого другого обработчика; четвер- 
тым является строка, соответствующая оператору, обработчик которого отсутст- 
вует. Он служит той же цели, что и переменная ФАЦТОГОАР в подпрограммах АЦТОГОАО. 


Если Рей приходится искать обработчик для потетнод, а такого обработчика нет, 
возбуждается исключительная ситуация. 


Чтобы избежать самогенерации или сделать так, чтобы при неудачной попытке 
самогенерации перегрузка вообще не производилась, можно определить специ- 
альный ключ перегрузки Ға116аск (переход в аварийный режим). Используются 
три его состояния: 


ипаеғ 


Если ключ ѓа11раск не установлен или явно установлен в ипдегГ, то последова- 
тельность событий при перегрузке не меняется: выполняется поиск обработ- 
чиков, производится попытка самогенерации и, наконец, вызывается обра- 
ботчик попеїћоа. Если эта последовательность действий неудачна, возбуждает- 
ся исключительная ситуация. 
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Ға15е 


Если значение Га11]Баск установлено, но соответствует ложному значению (на- 
пример, 0), самогенерация выполняться не будет. Рег! вызовет обработчик 
попеїћод, если он существует, и возбудит исключительную ситуацию в против- 
ном случае. 


Тгие 


Обеспечивает почти такое же поведение, как ипдет, но при невозможности син- 
тезировать обработчик с помощью самогенерации исключительная ситуация 
не возбуждается. Вместо этого Ре! возвращается к применению неперегру- 
женной версии оператора, как если бы прагмы џѕе оуеоад в этом классе вооб- 
ще не было. 


Перегрузка констант 


Рей позволяет изменить способ интерпретации констант с помощью директивы 
оуег10ай::сопѕіапі, которую удобнее поместить в метод іпрогі пакета. (При этом 
следует не забыть добавить директиву оуег1оаа: :гетоуе_сопѕїапї в метод ип1трог* 
пакета, чтобы восстановить прежний порядок вещей.) 


Обе директивы, оуегоа4::соп${ап{ и оуеоад: :гепоуе_сопѕїапї, принимают списки 
пар ключ/значение. Ключами могут быть іпїедег, Ғ1саї, біпагу, ди дг, а значения- 
ми – имена подпрограмм, анонимные подпрограммы или ссылки на код, которые 
будут обрабатывать константы. 


ѕир ітрогі { омег1оаа: :сопѕїапї ( іпіедег => \&іпїедег_ һагд1ег, 
Ғ1оат => \ёѓ1оаї һапо1ег, 
ріпагу => \ёбаѕе_һапд1ег, 
д => \ёѕігіпо_һапо1ег, 
дг => \ёгедех_Һапа1ег ) } 


Обработчики для 1птедег и ѓ1оат будут вызываться лексическим анализатором 
Рей для числовых констант. Это происходит независимо от прагмы сопѕїапї; про- 
стые инструкции, такие как: 


сире(12) + 1; # целое 
3. 14159265358979; я вещественное 


фуваг 
$рі 


будут вызывать указанные вами обработчики. 


Ключ б1пагу позволяет перехватывать двоичные, восьмеричные и шестнадцате- 
ричные константы. д – обрабатывает строки в одинарных кавычках (в том числе 
строки, введенные с помощью 4) и подстроки-константы в строках, заключаемых 
води 4х во внедренных документах (һеге йоситегіѕ). Наконец, дг обрабатывает не- 
изменяющиеся участки в регулярных выражениях, как описано в конце главы 5. 


Обработчик получает три аргумента. Первым является исходная константа в том 
виде, как она передается в Регі. Второй представляет результат интерпретации 
константы; например, 123_456 будет выглядеть как 123456. 


Третий аргумент определяется только для строк, проходящих через обработчи- 
ки ди ог, и может иметь одно из значений: 00, (, $ или їг, в зависимости от того, 
как должна использоваться строка. Значение 40 означает, что строка взята из ин- 
терполируемого контекста, например из двойных кавычек, обратных кавычек 
(БасКкисК$), оператора сопоставления п// или подстановки 5///. Значение д означает, 
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что строка взята из неинтерполированного контекста. Значение $ означает, что 
строка является строкой замены в операторе подстановки 5///, а їг – что строка 
входит в состав выражения 1г/// или у///. 


Обработчик должен вернуть скаляр, который будет использоваться вместо кон- 
станты. Часто этот скаляр является ссылкой на перегруженный объект, но ничто 
не мешает сделать что-либо более коварное: 


раскаде 01911бои6Тег: # Модуль. помещаемый в 0191ії0оиб1ег. рт 
изе омег1оаа; 


ѕиб 1трогт { оуег1ога: :сопѕтапт ( 1птедег => \&папо1ег, 
Ғ10аї => \&Пап0]ег ) } 


зиб һапд1ег { 
ту ($0г19, $іпсегр, $сопіехї) = @ ; 
гетигп $іпёегр * 2; # удвоение значений всех констант 


1; 


Обратите внимание, что в двух ключах используется один и тот же обработчик, 
и это вполне оправданно. Теперь, сказав: 


изе 0101і1роиБ1ег ; 


$1гоир1е = 123; # тгоиб1е получит значение 246 
$јеорагду = 3.21: й јеорагду получит значение 6.42 


вы измените окружающий мир. 


Если перехватываются строковые константы, рекомендуется также создать опе- 
ратор конкатенации ("."), потому что интерполируемое выражение типа “а$со!!" 
является просто сокращенной записью более длинного ‘аб’ фса 11". Анало- 
гично, отрицательные числа рассматриваются как отрицания положительных 
констант, поэтому нужно создать обработчик для пед, если перехватываются це- 
лые или действительные числа. (Раньше нам это не требовалось, потому что мы 
возвращали фактические числа, а не ссылки на перегруженные объекты.) 


Обратите внимание, что оме'10аа::сопѕїапї не распространяет свое действие на ком- 
пиляцию внутри е\а] на этапе выполнения, что можно рассматривать как ошиб- 
ку или функциональную особенность (бие или Ё{еабиаге) в зависимости от точки 
зрения. 


Открытые функции перегрузки 


В Реті версии 5.6 прагма оуег1оад предоставляет следующие функции для общего 
пользования. 


оуег1оаа::5їіг№а1(08.) 


Возвращает строковое значение, которое должен иметь ОВ. в отсутствие пере- 
грузки операции преобразования в строку (""). 


омег1оаа: :Оуег1оадеа(0в.7) 


Возвращает истинное значение, если для 081 действует какая-либо перегрузка 
операторов, и ложное в противном случае. 
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омег1оаа::Меїтћод(087Ј, ОРЕВАТОВ) 


Возвращает ссылку на код, реализующий перегрузку оператора ОРЕВАТОН, ко- 
гда тот выполняет действия над 087, или ипде+, если такой перегрузки не суще- 
ствует. 


Наследование и перегрузка 


Механизмы наследования и перегрузки имеют две точки соприкосновения. Во- 
первых, когда обработчик определяется как строка, а не как ссылка на код или 
анонимную подпрограмму, он интерпретируется как метод и может наследовать- 
ся от надклассов. 


Во-вторых, любой класс, являющийся производным от перегруженного класса, 
в свою очередь подвергается этой перегрузке. Иными словами, перегрузка насле- 
дуется. Набор обработчиков в классе являезся рекурсивным объединением обра- 
ботчиков во всех предках этого класса. Если обработчик присутствует в несколь- 
ких предках, фактически используемый обработчик определяется обычными пра- 
вилами наследования. Например, если класс А1рћа наследует классы Веїа и батта 
в указанном порядке, и класс Веїа перегружает + посредством \&ВеТа::р1и$_$и6, 
а класс батта перегружает + строкой "р1из пеїћ", при попытке применения + к объ- 
екту А1рћһа будет вызван метод Веїа:.р1иѕ $00. 


Поскольку значение ключа ѓа116аск не является обработчиком, его наследование 
не подчиняется указанным выше правилам. В текущей реализации Рег] исполь- 
зуется значение таг1раск для первого перегруженного предка, но этот выбор про- 
изволен и может быть изменен без уведомления (по крайней мере, без особого уве- 
домления). 


Перегрузка на этапе выполнения 


Поскольку директивы изе выполняются на этапе компиляции, единственный 

способ изменить перегрузку на этапе выполнения — использовать функцию е\уа1: 
ема1 " изе омег1оад `+` => \&ту ада 

Можно также сказать: 


ема1 “ по омег10ад ‘+ ‘--’ ‘<=’ 


хотя использование таких конструкций на этапе выполнения выглядит сомни- 
тельным. 


Диагностика перегрузки 


Если Рей скомпилирован с ключом -ООЕВУССТ№, при запуске программы с клю- 
чом -Ро или его эквивалентом можно увидеть диагностические сообщения, ка- 
сающиеся перегрузки. Узнать, какие операции перегружены. можно также с по- 
мощью команды п встроенного отладчика Рег]. 


Если вы сейчас ощущаете перегрузку, то следующая глава, возможно, расставит 
все по своим местам. 


Связанные переменные 


Некоторые человеческие начинания требуют маскировки. Иногда ее целью явля- 
ется обман, но чаще намерение заключается в передаче правдивой информации 
на более глубоком уровне. Например, приглашая соискателя на собеседование, 
интервьюер рассчитывает, что тот придет в галстуке, чтобы показать серьезную 
заинтересованность в получении работы, хотя оба знают, что он никогдг не будет 
носить галстук на работе. Если вдуматься, то это странно: повязав на шею кусок 
ткани, можно чудесным образом получить работу. В культуре Регі оператор т1е 
(«связывать» или «галстук») играет схожую роль: он позволяет создать обычную 
с виду переменную, которая под своей личиной скрывает полноценный объект со 
своей собственной интересной личностью. Это просто некоторая магия, примерно 
как вытащить кролика из шляпы. 


Скажем иначе, разыменовывающие символы $, 6, % и + перед именем переменной 
многое говорят Рег| и программирующим на нем: каждый из них предполагает 
определенный набор архетипов поведения. Эти архетипы можно изменять раз- 
личными полезными способами с помощью ї1е, связывая переменные с класса- 
ми, реализующими иные наборы режимов поведения. Например, можно создать 
обычный хеш и связать его (іе) с классом, превращающим хеш в базу данных, 
в результате чего при чтении из хеша Ре! как по волшебству будет извлекать дан- 
ные из внешнего файла базы данных, а при записи в хеш – сохранять данные во 
внешнем файле базы данных. В данном случае «как по волшебству» означает «не- 
заметно сделать что-то очень сложное». Как гласит старое изречение, любая дос- 
таточно развитая технология неотличима от сценария Реп. (Без шуток, для тех, 
кто работает с внутренними механизмами Регі, тағіс (волшебство) – это техни- 
ческий термин, означающий любую дополнительную семантику применения та- 
ких переменных, как %Е№\ или %516. Связанные переменные — это всего лишь рас- 
ширение такого волшебства.) 


В Рей уже есть встроенные функции @бтореп и йбтс10ѕе, которые волшебным обра- 
зом связывают переменные типа хеш с базами данных, однако они остались с тех 
времен, когда в Рег] не было їіе. Сейчас їіе предоставляет более общий механизм. 
По правде сказать, Ре! реализует Чбтореп и йбтс10ѕе как раз посредством їіе. 
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Скаляр, массив, хеш или дескриптор файла (через его фуре?106) можно связать 
с любым классом, имеющим методы, которые перехватывают и эмулируют оне- 
рации доступа к этим переменным. Первый из них вызывается в месте вызова са- 
мой функции їіе: связывание переменной всегда вызывает конструктор для соз- 
дания объекта, который Ре! прячет от вас внутри «обычной» переменной. Впо- 
следствии этот объект всегда можно извлечь с помощью функции 11е0: 


Не УААТАВЕЕ, СІ АЅ5МАМЕ, 1157; # привязывает УАВТАВЕЕ к СТАЗЗМАМЕ 
$орјесї = +іей УАРТАВЕЕ; 


Эти две строки эквивалентны следующей: 
фобјесі = іе УААТАВЕЕ, СІАЅЅМАМЕ, 1 І5Т; 


После связывания с обычной переменной можно работать как всегда, но при каж- 
дом обращении к ней автоматически будут вызываться методы спрятанного в ней 
объекта; вся сложная организация класса скрывается за этими вызовами мето- 
дов. Если впоследствии потребуется разорвать связь между переменной и клас- 
сом, можно отвязать переменную: 


ипііе УААТАВІЕ; 


Функцию їіе можно воспринимать как необычного вида 01е55, за исключением 
того, что «благословляется» голая переменная, а не ссылка на объект. Кроме того, 
функция Не может принимать дополнительные параметры, совсем как конструк- 
тор, что не очень удивляет, поскольку фактически она вызывает конструктор, 
имя которого зависит от типа связываемой переменной: ТТЕЗСАЕАН, ТТЕАВВАУ, ТТЕНАЗН 
или ТІЕНАМ№МІЕ.! Эти конструкторы вызываются как методы класса с заданным 
СІАЅЅМАМЕ в качестве инвоканта и дополнительными аргументами, указанными 
в 1157, (Переменная УАЯТАВИЕ не передается конструктору.) 


Каждый из этих четырех конструкторов возвращает объект особым образом. Им, 
как и другим методам класса, безразлично, что они вызваны из ї:е, поскольку 
при желании их всегда можно вызвать непосредственно. В некотором смысле все 
волшебство заключено в їіе, а не в классе, реализующем связывание. Что касает- 
ся класса, то это обычный класс с необычными именами методов. (Кстати, неко- 
торые связанные модули предоставляют дополничельные методы, невидимые че- 
рез связанную переменную; эти методы должны вызываться явно, как любые 
другие методы объекта. Такие дополнительные методы могут предоставлять до- 
полнительные услуги блокировки файлов, защиты транзакций и в принципе чего 
угодно, что может делать метод экземпляра объекта.) 


Поэтому данные конструкторы вызывают 01655 и возвращают ссылку на объект, 
как любой другой конструктор. Эта ссылка не обязательно должна ссылаться на 
переменную того же типа, что и связываемая; она лишь должна пройти обработ- 
ку функцией 01055, чтобы связанная переменная могла найти обратную дорогу 
к вашему классу в поисках поддержки. Например, в нашем длинном примере 
с ТТЕАВВАУ будет использоваться объект на основе хеша, в котором удобно хранить 
дополнительную информацию об эмулируемом массиве. 


1 Поскольку конструкторы имеют непохожие имена, можно даже создать единый класс, 
который реализует их все. Это позволит связывать скаляры, массивы, хеши и дескрип- 
торы файлов с одним и тем же классом, хотя обычно так не делают, поскольку это за- 
трудняет написание других магических методов. 
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Функция Пе не загрузит модуль вместо программиста с помощью изе или гедиігє — 
он должен при необходимости сделать это самостоятельно, прежде чем вызвать 
тіе. (С другой стороны, для обратной совместимости функция 96тореп попытается 
загрузить через изе ту или иную реализацию модуля базы данных. Однако ее вы- 
бор можно отменить явным вызовом џѕе, при условии, что загружаемый модуль 
присутствует в списке опробуемых функцией йбтореп. Более полное описание 
можно найти в электронной документации по модулю Апу0ВМ_Рі1е.) 


Методы, вызываемые связанной переменной, имеют предопределенные имена, 
например ҒЕТСН и 5ТОВЕ, поскольку они вызываются неявно (т. е. в ответ на некото- 
рые события) изнутри Рей. Эти имена записываются целиком ЗАГЛАВНЫМИ БУКВАМИ, 
что является распространенным соглашением для таких неявно вызываемых 
программ. (В число других специальных имен, следующих этому соглашению, 
входят ВЕСТМ, СНЕСК, ОМІТСНЕСК, ІМІТ, ЕМО, РЕЅТВОҮ и АТО ОАО, а также ИМТУЕВЗА! ->МЕВЅТОМ. 
На самом деле, почти все имена предопределенных переменных и дескрипторов 
файлов в Ре! записываются буквами в верхнем регистре: ЭТОТА, ЗУРЕН, СОВЕ, 
СОВЕ: :С.ОВАГ, ВАТА, @ЕХРОВТ, @Т№, @ТЗА, @ААСУ\У и ЕМУ, Встроенные операторы и прагмы 
ударяются в другую крайность и вообще не используют заглавные буквы.) 


Начнем с того, что расскажем о самом простом: как связать скалярную перемен- 
ную. 


Связывание скаляров 


Чтобы иметь возможность связывать со скалярами, класс должен определять сле- 
дующие методы: ТТЕЗСАЕГАН, РЕТСН и $ТОВЕ (возможно, также ИМТТЕ и ОЕЗТВОУ). При 
связывании скалярной переменной вызывается метод ТІЕЅСАІАВ, при чтении ска- 
лнрной переменной — метод ҒЕТСН, а в момент присваивания значения этой пере- 
менной вызывается 5ТОВЕ. Если сохранить объект, который вернет функция їіе 
(или позже извлечь его с помощью ї1е0), можно самостоятельно обращаться к ле- 
жащему в основе объекту: методы ҒЕТСН и 5ТОНЕ не будут при этом вызываться. 
В самом объекте никакого волшебства нет, это скорее предмет быта. 


Метод И\ТТЕ, если определен, вызывается при отвязывании переменной. Это дает 
возможность вышолнить дополнительные действия или освободить ресурсы пе- 
ред исчезновением связи и перед тем, как переменная превратится в обычную пе- 
ременную. 


Метод ОЕЗТНОУ, если определен, вызывается при исчезновении последней ссылки 
на связанный объект – как для всякого другого объекта. Это случается, когда 
программа завершает работу или вызывается функция ип 1е, удаляющая ссыл- 
ку, используемую Че. Однако џипііе не удаляет ожидающие обработки ссылки, 
которые могли быть помещены куда-то еще; вызов ОЕЗТНОУ тоже откладывается до 
того времени, когда исчезнут эти ссылки. 


Пакеты Тіе::Ѕсајаг и Тіе::5105сајаг из стандартного модуля Тіе::5са1аг предостав: 
ляют некоторые простые определения базового класса на случай, если вам не за: 
хочется определять эти методы самостоятельно. Тле::5са1аг предоставляет про- 
стейшие методы, которые делают очень мало, а Т1е::5{95са1аг предоставляет мето- 
ды, благодаря которым связанный скаляр ведет себя как обычный скаляр Рег]. 
(Это кажется совершенно бесполезным, но иногда требуется некоторая простая 
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обертка для обычной семантики скаляров — например, чтобы подсчитать, сколь- 
ко раз выполнялось присваивание некоторой переменной.) 


Прежде чем демонстрировать подробный пример и разбирать его механику, да- 
дим вам маленький кусочек — для возбуждения аппетита и чтобы показать, как 
просто все на самом деле. Вот программа целиком: 


#1 /изг/б1п/рег1 

раскаде Сепїѕір1е; 

зир ТТЕЗСАГАВ { б1еѕѕ \ту $5е1#, $1 } 

зиб ЅТОВЕ { $4 $ [0] } = $ [1] } # сделать дела по умолчанию 

вир РЕТСН { өргіпї? “%.02Р”, ${ ту $561? = зн1 ЕЕ } } # округлите значение 


раскаде паіп; 

тіе $Биск$, “Сепіѕ161е”; 

$6исКѕ = 45.00; 

фрискз *= 1.0715; # налог 

$биск5 *= 1.0715; # обложить налогом повторно! 
ргіпЕ “С вас, пожалуйста, $Бискз. \п" 


При выполнении этой программы выводится: 
С вас, пожалуйста, 51. 67. 

Чтобы увидеть разницу, закомментируйте вызов їіе, и вы получите: 
С вас, пожалуйста, 51.66505125 


Признаем, что работы здесь проделано больше, чем при обычном округлении чисел. 


Методы связывания скаляров 


Теперь, когда вы увидели, что нам предстоит, создадим более сложный класс для 
связывания скаляров. Мы не станем использовать в качестве базового класса го- 
товый пакет (в основном за счет простоты скаляров), а вместо этого рассмотрим 
поочередно все четыре метода и создадим класс с именем б-а1а7Р11е. Скаляры, 
связанные с этим классом, содержат простые строки, и каждая такая переменная 
неявно связана с файлом, где хранится эта строка. (Переменные можно имено- 
вать так, чтобы их имена напоминали о том, на какие файлы мы ссылаемся.) Пе- 
ременные связываются с классом так: 


и5е эса1агЕ11е; # Загрузить Ѕса1агРі1е рт 
Не $сате1, “Зса1агЕ11е” `/4+тр/сате! . 101” 


При связывании переменной ее прежнее содержимое уничтожается, а обычную 
семантику переменных замещает внутренняя связь между переменной и ее объ- 
ектом. При запросе значения переменной $сапе1 теперь будет читаться содержи- 
мое файла /ётр/сате оф, а в результате присваивания в файл /ётр/сате Мо} бу- 
дет записываться новое значение, уничтожающее предшествующее. 


Связывание выполняется для переменной, а не для значения переменной, поэто- 
му природа связанной переменной не распространяется путем присваивания. До- 
пустим, например, что копируется связанная переменная: 


$дготедагу = $сате1 
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Вместо того чтобы как обычно прочитать значение скалярной переменной $сапе1, 
Рей вызовет метод ҒЕТСН нижележащего ассоциированного объекта. Все происхо- 
дит так, как если бы было написано: 


$Чготедагу = (11е9 $сатет )->РЕТСН(): 


Если сохранить объект, полученный при вызове їіе, эту ссылку можно использо- 
вать непосредственно, как в следующем примере: 


фс1ої = їіе $сате1, “Зса1агР11е”, "/ітр/сате1. 101”; 
$Оготедагу = $фсате1; # через неявный интерфейс 
$Оготедагу = $с101->РЕТСН(); # то же, но явно 


Если класс реализует другие методы (помимо ТТЕЗСАЕАВ, РЕТСН, ЭТОВЕ и ОЕЗТНОТ), их 
можно вызывать вручную при помощи $с10ї. Однако лучше заниматься своим де- 
лом и не соваться в нижележащий объект, поэтому можно часто видеть, что зна- 
чение, полученное при вызове їіе, игнорируется. Добраться до объекта, если он 
понадобился (например, если документация класса упоминает другие нужные 
вам методы), можно также вызовом 11е9. Игнорирование возвращаемого объекта 
также предотвращает некоторые виды ошибок, о которых рассказывается далее. 


Вот преамбула нашего класса, которую мы поместим в ЅсаіагЕйе.рт: 


раскаде Эса1агЕ11е; 


изе Сагр; # Деликатное распространение сообщений об ошибках. 
и$е ѕ51гіст; # Будем придерживаться некоторой дисциплины. 
иѕе маги1п0$; в Включение вывода предупреждений 


# с лексической областью видимости 
иѕе магпіпд5: : гедіѕТег; # Разрешить пользователю сказать 
# "иѕе магпіпоѕ `Ѕса1агЕ11е'”. 
ту Фсоипт = 0; # Внутренний счетчик связанных объектов Зса1агЕ11е. 


Стандартный модуль (агр экспортирует подпрограммы сагр, сгоак и сопЁе5$, кото- 
рые будут использованы далее в примерах данного раздела. Как обычно, допол- 
нительные подробности о Сагр читайте в документации этого модуля. 


В классе определены следующие методы. 
СЕАЗЗМАМЕ->ТТЕЗСАЕАН (1757) 


Метод класса ТТЕЗСАГАВ вызывается при связывании скалярной переменной. 
Необязательный аргумент / 157 содержит параметры для правильной инициа- 
лизации объекта. (В нашем примере есть только один параметр: имя файла.) 
Метод должен возвращать объект, но это не обязательно должна быть ссылка 
на скаляр. Однако в нашем примере это так: 


ѕиб ТТЕЗСАГАВ { # в ЅсаЈагРі1е. рт 
ту $с1а55 = ЗВАРЕ; 
ту $?і1епате = эВ Е; 
фсошпї++; # Лексическая переменная с областью видимости 


# в файле, закрытая в классе. 
гетигп 61езз \ФҒілепате, $с1а55; 


} 


Поскольку не существует скалярного эквивалента формирователей аноним- 
ных массивов и хешей, [] и {}, мы просто передаем функции 01е5$ объект ссыл- 
ки лексической переменной, который становится анонимным, как только имя 
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выходит из области видимости. Это срабатывает (то же можно делать с масси- 
вами и хешами), если переменная действительно является лексической. Если 
попробовать проделать то же с глобальной переменной, может показаться, что 
все получилось, пока вы не попытаетесь создать еще один сатеі.іої. Не взду 
майте написать что-нибудь подобное: 


зиб ТТЕЗСАГАЯ { б1еѕѕ \$ [1], $_[0] } # НЕВЕРНО, если ссылка 
я на глобальную переменную. 


Более надежный конструктор может проверять доступносте файла. Сначала 
мы проверим доступность файла для чтения, поскольку не хотим уничтожить 
существующее значение. (Иными словами, не следует полагать, что пользова- 
тели сначала осуществляют запись. Они могут копить старые файлы Сате] 
Гоё от предыдущих прогонов программы.) Если нельзя открыть или создать 
файл с указанным именем, вежливо сообщим об ошибке, вернем ипіеѓ и, воз- 
можно, выведем предупреждение средствами сагр. (Можно использовать для 
этого и сгоак, это дело вкуса.) Попробуем определить, интересно ли пользова- 
телю наше предупреждение, при помощи прагмы магп1п0$: 


зиб ТТЕЗСАЁАН { # в ЅсајагЕі1е. рт 
пу $с1а$5 = ЅһіЁЕ; 
пу $Е11епате = 5ћіҒТ; 
ту $#һ; 
ТР ( -г -м $#і1епате ) { 
с10ѕе $Ри; 
фсоџпі++; 


гетигп 61ез$ \$Ғі1епате, $с1а55; 
} 
сагр "Невозможно связать $Е11епате: $!” 1! магп1п95: :епаб1ед( ); 
гефигп: 


} 
Теперь, имея конструктор, можно связать скаляр $5їгіпо с файлом сате4оЕ: 
Не (%ѕ1гіпд, “ЅсаїагҒі1е”, `сате1. 100") ае: 


(Мы все еще делаем некоторые неразумные допущения. В производственной 
версии мы, вероятно, открыли бы дескриптор файла и запомнили его вместе 
с именем файла до конца действия связывания, заблокировав указатель для 
монопольного использования с помощью #1оск. В противном случае мы не за- 
щищены от ситуации гонок – см. раздел «Ошибки синхронизации» главы 20.) 


ЕГР- >ЕЕТСН 


Этот метод вызывается при обращении к переменной (т.е. при чтении ее значе- 
ния). Он не принимает аргументов помимо объекта, связанного с переменной. 
В нашем примере объект содержит имя файла. 


зиб РЕТСН { 
пу $ѕе1# = зи Е 
сопРез$ "Я не метод класса” ип1еѕѕ геЁ фѕе1ғ; 
гефигп ип1ез$ ореп ту $#һ, $$зе1г; 
геад($#һ, му $уа1ше, -з $#һ); # №В: не используйте -$ с конвейерами! 
геїигп $уа1ие, 
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На этот раз мы решили выйти из себя (возбудить исключительную ситуацию), 
если ҒЕТСН вернет что-либо, отличное от ссылки. (Когда он вызван как метод 
класса или по ошибке вызван как подпрограмма.) Другого способа вернуть 
ошибку нет, поэтому такой способ, вероятно, правильный. Рей все равно воз- 
будил бы исключительную ситуацию, попытайся мы разыменовать $е1?; так 
что мы просто стараемся соблюдать вежливость и используем сопѓеѕѕ, чтобы 
извергнуть всю последовательность вызовов из стека на экран пользователя. 
(Если это можно считать вежливостью.) 


Теперь мы можем увидеть содержимое сатеі.10і, сказав следующее: 


їіе($51гіпо, "Ѕса1агҒіле", “сате1.10т“); 
ргіпї $5ігіпо; 


ЗЕЁЕ->ЗТОВЕ( ИАЕИЕ) 


Этот метод вызывается, когда переменной присваивается значение. Первый 
аргумент, 5ЕІ Е, всегда является объектом, связанным с переменной; УАШЕ яв- 
ляется тем, что присваивается переменной. (Мы вольно обращаемся с терми- 
ном «присваивается» — любая операция, модифицирующая переменную, мо- 
жет вызвать 5ТОВЕ.) 


ѕир ЅТОВЕ { 
пу($ѕе1?, $уа1ие) = @ ; 
ге? $зе1+ || сопРезз “не метод класса“; 
ореп(ту $1, <", $$зе1{) || сгоак "нельзя разрушить $%ѕе1#: $'" 
ѕуѕмгіте($%#п, $уа1џе) == 1епоїһ $уаТие 

|| сгоак “нельзя записать в $%5е1#: $1”; 

с10ѕе($+һ) || сгоак "нельзя закрыть $$е1#: $!” 
геигп фуа10е; 

} 


После «присваивания» возвращается новое значение, поскольку это то, что де- 
лает присваивание. Если присваивание оказалось безуспешным, выводится 
сообщение посредством сгоак. Возможные причины для сбоев: отсутствие раз- 
решения на запись в файл, отсутствие места на диске или нападение гремли- 
нов на контроллер диска. Иногда вы управляете волшебством, а иногда вол- 
шебство управляет вами. 


Теперь мы можем выполнить запись в сате Ню: 
{1е($31г1п9, “ЗсаТагРа1е”, “сате1. 10%”); 
фзїгіпо = "Вот первая строка сате1. 101\п”; 
$51г119 .= "А вот еще одна строка, дописанная автоматически. \п”; 
ФЕЕЕ->ИМТТЕ 
Этот метод вызывается функцией ип 1е, и только ип11е. В данном примере он 
не используется, поэтому лишь покажем, как он вызывается: 


зир ЦМТЕ { 
пу $ѕе1? = ѕһіғї; 
сопѓеѕѕ "Отвязано! ”: 


} 


См. предупреждение в разделе «Неочевидная ловушка при отвязывании». 
ЕТ Е->рЕЅТВАОҮ 
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Этот метод вызывается непосредственно перед тем, как объект, ассоциирован- 
ный со связанной переменной, будет уничтожен сборщиком мусора, на случай, 
если необходимо сделать что-то особенное перед уничтожением. Как и для дру- 
гих классов, этот метод редко необходим, так как Рег] автоматически освобож- 
дает память умирающего объекта. Наш метод ОЕЗТНОУ будет уменышать счет- 
чик связанных файлов: 


ѕиб рЕЅТВОҮ { 
ту $ѕе1# = ѕһіғ+; 
сопғеѕѕ "Это не метод класса” ип1еѕѕ геЁ $5е1ғ; 
фсошпі--; 

} 


Теперь можно создать дополнительный метод класса и для извлечения текуще- 
го значения счетчика. Фактически неважно, вызывается он как метод класса 
или как метод объекта, однако после вызова ОЕЗТВОУ у вас уже нет объекта, 
правда? 


ѕир соипї { 
ННН ту $іпуосапі = ѕһіғі; 
$соипї; 


} 
В любой момент можно вызвать его как метод класса: 


ТЕ (Зса1агРАЛе->еоуйт) { 
магп "Где-то еще есть связанные Ѕса1агЕі1еѕ. \п“ 


} 


Это, пожалуй, все на данную тему. На самом деле, это даже больше чем все, по- 
скольку мы реализовали ряд полезных особенностей, продиктованных сообра- 
жениями полноты, надежности и общей эстетики (или отсутствия таковой). Ко- 
нечно, можно создавать более простые классы ТТЕЗСАСАН. 


Переменные волшебных счетчиков 


Вот простой класс Тіе::Соџпїег, созданный по образу и подобию одноименного мо- 
дуля из СРАМ. Переменные, связанные с этим классом, увеличиваются на 1 при 
каждом обращении к ним. Например: 


Не ту Фсоипеег, “Т1е: :Соипфег”, 100; 
@аггау = дм /Кед бгееп В1ие/; 


Тог ту $со1ог (@аггау) { # Выведет: 
ри1пЕ ” $соиптег $со1ог\п”; # 101 Вед 
} # 102 бгееп 
# 103 В1ше 


Конструктор принимает в качестве необязательного аргумента начальное значе- 
ние счетчика, по умолчанию равное 0. Присваивание счетчику устанавливает но- 
вое значение. Вот этот класс: 


раскаде Тіе: :Соипег; 

зир РЕТСН { + $4 $ [0] } } 

ѕир ЅТОВЕ { $1 $ [0] } = % [1] } 
ѕир ТІЕЅСАГАВ { 
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ту ($с1аз$, $уа1ие) = @_, 
$уаше = 0 ип1еѕѕ деѓіпед $уа1ие; 
р1еѕѕ \$уа1ие => $с1а55; 

} 


15 # если в модуле 


Видите, какой он маленький? Чтобы построить такой класс, не требуется много 
кода. 


Обход значений в цикле 


Благодаря волшебству связывания, массив может вести себя как скаляр. Интер- 
фейс їтіе способен преобразовывать скалярный интерфейс в интерфейс массива. 
Модуль Пе: :Сус1е из архива СРАМ использует скаляр для обхода в цикле значе- 
ний в массиве. Объект запоминает текущее положение и перемещается на один 
шаг вперед при каждом обращении. По достижении конца он автоматически воз- 
вращается в начало: 


раскаде Тіе: :Сус1е; 


ѕир ТТЕЗСАЁАН { 
ту $с1а55 = ЅһіҒЕ; 
ту $1151 геї = 5һіҒЕ; 
геёигп ип1ез$ геҒ $1151 ге? ед ге? [1], 
пу @ѕһа110м сору = тар { $_ } @$115ї1 геғ; 
пу $5е1# = [ 0, эса1аг @ѕһа110м сору, \@ѕһа110м сору ]; 
р1еѕз $зе1, $с1а55; 


зиб РЕТСН { 
ту $3е1 = эВ Е; 
му $1пдех = $$зе1[0]ч+; 
$фѕе1ғ[0] %= $5е1ғ#->(1]1; 
геїшгп $ѕе1#->[2]->[ $1паех ]; 


ѕиб ТОНЕ { 
ту $ѕе1# = зп РЕ; 
ту $1151 ге? = ѕһіРЕ; 
геёигп џп1еѕѕ ге? $11$+_гег ед ге? []. 
фѕе1? = [ 0, зса1аг @$115ї ге, $1151 геғ ] 


} 


Этот объект удобно использовать для поочередного применения классов С55 
в смежных строках в НТМГ-таблице без усложнения кода: 


тіе ту $гом с1а55, “Тле::Сус1е”, [ дм(ода емеп) ]; 


Гог ту $і+ет (@ітетѕ) { 
ргіпі 99(<Ег с1аѕ5="$гом с1а55">...</їг>); 
} 


Точно так же легко можно было бы увеличить число классов С5®, не изменяя ос- 
новной код программы: 
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тіе му $гои с1азз, “Тіе: :Сус1е“, [ 9м(гед дгееп Б1ие) ], 


Волшебное изгнание $_ 


Следующий любопытно-экзотический класс, ипдегзсоге!, позволяет сделать неза- 
конными нелокализованные применения $_. Вместо директивы изе, вызывающей 
метод класса іпрогї, этот модуль должен загружаться директивой по, чтобы вы- 
звать редко используемый метод ип1трог{ (см. главу 11). Пользователь говорит: 


по ипдегзсоге; 


и после этого любое использование $_ как нелокализованной глобальной пере- 
менной будет возбуждать исключительную ситуацию. 


Вот маленький набор тестов для модуля: 


#1 /иѕг/ріп/регі 
по опдегзсоге; 


ӨТеѕїѕ = ( 
“Присваивание” => ѕиб { $_ = "Вад" } 
Чтение” => 5и6 { ргіпї }, 
“Сопоставление” => ѕир { $х = /райпеѕѕ/ }, 
"Отсечение" => вир { спор }, 
“Проверка файла” => ѕиб { -х }, 
"Вложенность" => вир { Гог (1..3) { ргіпт } }, 


); 


мһі1е ( (Фпапе, $соде) = ѕр1ісе(@їеѕїѕ, 0, 2) ) { 
ргіпі “Проверяю $пате: “ 
ема1 { &$соде }; 
ргіпї $@ ? “обнаружено” “ отсутствует!“ 
ргіпі “\п”; 
} 
который выведет следующее: 


Проверяю Присваивание: обнаружено 
Проверяю Чтение: обнаружено 

Проверяю Сопоставление: обнаружено 
Проверяю Отсечение: обнаружено 
Проверяю Проверка файла: обнаружено 
Проверяю Вложенность` 123 отсутствует" 


В последнем случае «отсутствует» получено благодаря должной локализации 
в цикле Гог и потому безопасному доступу. 


А вот и сам любопытно-экзотический модуль ипоегѕсоге. (Мы ведь говорили, что 
он любопытно-экзотический?) Он работает, поскольку волшебство связывания 
надежно скрыто с помощью 10са1. Модуль вызывает їіе в методе инициализации, 
поэтому геди1ге тоже работает. 


раскаде ипдегзсоге; 
изе магпіпоѕ; 


1 Любопытно отметить, что класс ипдегзсоге появился в качестве примера в одном из 
первых изданий этой книги, затем перекочевал в книгу «Рег! СооКБооК», вдохновив- 
шись которой, Дэн Когай (ап Кора!) создал модуль СРАМ. 
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ие эго; 
изе Сагр (); 
оог $МЕВЗТОМ = ѕргіпї? "%9.%029”. а$Веу1з1от: 0.1 $ =- /(\9+)/д; 


ѕир ТТЕЗСАЁАН { 
пу (Фрко, $собе. $тз9) = @ ; 
б1еѕѕ [$%соде, $59], Фрка; 


ѕир оип1трогі { 
ту $рко = ЅһіЁЇ; 
пу фасііоп = >һіғі, 
по ѕігісї "ге?ѕ”; 
ту $соде = ге фас оп 
? $астіоп 
; (Фасёіоп 
? \8{ “Сагр:: фаст1оп } 
: \&Сагр: :сгоак 
); 
пу $1509 = эпаРЕ || `$ 15 Рогб19деп ; 
ипііе $_ 11 мед $ ; 
тіе $, __РАСКАСЕ _, $соде, $т$д; 
} 


зиб ітрогі{ ипые $_} 


зиб РЕТСН{ $_[0]->[01($_[0]->[11) } 
зи $ТОВЕ{ $_[0]->[03($_[0]-2>[11) } 


1; # Конец ипдегзсоге 


Тяжело с пользой смешивать вызовы іѕе и по для этого класса в программе, по- 
скольку все они происходят на этапе компиляции, а не на этапе выполнения. 
Можно было бы непосредственно вызвать Јпіегѕсоге->17оогї и Џпаегѕсоге->ипітрогї, 
как это делают изе и по. Но обычно, чтобы отречься от своих слов и позволить себе 
снова свободно использовать $_, следует применить к этой переменной 1оса1, в чем 
и заключалась задумка. 
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В классе, реализующем связанный массив, должны быть определены по крайней 
мере методы ТТЕАВВАУ, ЕЕТСН и ЭТОВЕ. Есть много необязательных методов: среди 
них, разумеется, вездесущие ИМТТЕ и ОЕЗТВОХ, а также методы 5ТОВЕЅІ/Е и РЕТСНУТЕЕ, 
обеспечивающие доступ к $#аггау и эса1аг(®аггау). Кроме того, когда Рег! необхо- 
димо очистить массив, вызывается С1ЕАВ, а когда Ре! требуется упреждающе вы: 
делить дополнительную память для настоящего массива, вызывается ЕХТЕЮ. 


Можно также определить методы РОР, РИЗН, ЗНТЕТ, ИМНІҒТ, ЗРЕТСЕ, ОЕЕТЕТЕ и ЕХІЅТ5, 
если требуется, чтобы соответствующие функции Рег! работали со связанным 
массивом. Класс Тіе::Аггау может служить базовым для реализации первых пяти 
из этих функций в терминах ҒЕТСН и ЗТОВЕ. (Стандартная реализация методов 
РЕТЕТЕ и ЕХТЗТ$ в Тіе::Аггау просто вызывает сгоак.) Если ГЕТСН и ЭТОВЕ определены, 
тип структуры данных, содержащейся в объекте, не имеет значения. 
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С другой стороны, класс Т1е: :ЭтдАггау (определен в стандартном модуле Т1е: :Аггау) — 
это базовый класс с методами по умолчанию, которые предполагают, что объект 
содержит обычный массив. Вот простой класс связываемого массива, использую- 
щий Тіе.:510Аггау, благодаря чему ему требуется определить только методы, реа- 
лизующие нестандартное поведение. 


#1 /озг/61п/рег1 
раскаце С1оскКАггау, 
изе Т1е: :Аггау; 
сиг @ТЗА = “Т1е. .ЗтаАггау“; 
зи РЕТСН { 
пу($501ғ#, $р1асе) = @ ; 
фѕе1ғ >[ $р1асе % 12 1; 
} 


ѕир УТОВЕ { 
пу($%ѕе1#, $р1асе, Фуа1ие) = @_, 
$561ғ->[ $р1асе % 12 ] = $иаше, 
} 


раскаде та1п; 

{1е ту @аггау, "С1оскАггау"; 
баггау = ( “а”... "2" ); 
ргіпі "@аггау\п”; 


Если запустить эту программу, она выведет ‘у 2 ор д гз ї з ум х". Этот класс 
представляет массив с дюжиной элементов, подобно циферблату часоє, пронуме- 
рованных от 0 до 11. Если запросить пятнадцатый элемент массива, вы получите 
третий. Считайте это вспомогательным средством для тех, кто не научился чи- 
тать время в 24-часовом формате. 


Методы связывания массивов 


Это был простой способ. Теперь некоторые важные бытовые подробности. Для их 
демонстрации создадим массив, границы которого фиксируются при его созда- 
нии. Если попытаться обратиться к элементу за пределами этих границ, возбуж- 
дается исключительная ситуация. Например: 


уе ВоипаедАггау; 
{1е @аггау, “ВоипдедАггау”, 2; 


$аггау[0] = “отлично”; 

$аггау[1] = “хорошо”; 

фаггау[2] = “великолепно”; 

$аггау[3] = “тпру! “; # Запрещено: выводится сообщение об ошибке. 


Код преамбулы для этого класса таков: 


раскаде ВоипаедАггау; 
иѕе Сагр; 
иѕе ѕігісї: 


Чтобы в дальнейшем избежать необходимости определять метод ЗРЕТСЕ, унаследу- 
ем класс Пе: :Аггау: 
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иѕе Пе: :Аггау; 
оиг @ІЅА = ("Тіе: :Аггау”); 


СТАЗЗМАМЕ->ТТЕАВВАУ( ЕТ5Т) 


Будучи конструктором класса, метод ТТЕАЛЯВАУ должен возвращать «освящен- 
ную» ссылку, через которую будет эмулироваться связанный массив. 


В следующем примере, чтобы показать, что в действительности не обяза- 
тельно возвращать ссылку на массив, для представления нашего объекта была 
выбрана ссылка на хеш. Хеш хоропто подходит на роль обобщенного типа дан- 
ных: элемент хеша с ключом “ВОИ№О" будет хранить индекс верхней границы, 
а элемент с ключом "РАТА" будет хранить фактические данные. Если кто-то по- 
пытается разыменовать возвращаемый объект вне пределов класса (несомнен- 
но, считая, что это ссылка на массив), возникнет исключительная ситуация. 


зи ТТЕАВВАУ { 
пу $с1аз$ = зР1 РЕ; 
ту $роцпа = =һі?Т; 
сопғеѕѕ “иѕаде: їіе(\@агу, ВоупдедАггау’, тах_зибзсгарт)” 
1 @ || $боџипа =- /\0/; 
гефигп б1еѕѕ { ВООМ => $боџипа. РАТА => [] }, $с1азз; 
} 


Теперь можно сказать: 


{1е(@аггау, “ВоипаедАггау“, 3); # допускается максимальный индекс 3 


и гарантировать, что в массиве будет не более четырех элементов. При чтении 
или записи отдельного элемента массива вызываются ГЕТСН и ЭТОВЕ, как для 
скаляров, но с дополнительным аргументом, содержащим индекс. 


ЗЕЁЕ->РЕТСН(СТМОЕХ) 


Этот метод вызывается при обращении к отдельному элементу связанного мас- 
сива. Помимо ссылки на объект он получает еще один аргумент: индекс эле- 
мента, значение которого мы пытаемся извлечь. 


ѕир РЕТСН { 
пу ($ѕе1?, $іпдех) = @_ 
і? ($іпдех > $ѕе1#->{ВО0МО}) { 
сопѓёеѕѕ “Аггау 006 $1пдех > $%ѕе1#->{ВО0МО+": 
} 
гетогп $5е1#-> {АТА} [$1паех]; 
} 


ЗЕЕ->5ТОВЕ(ТМОЕХ, УАШЕ) 


Этот метод вызывается, когда присваивается значение элементу связанного 
массива. Помимо ссылки на объект он принимает два аргумента: индекс эле- 
мента и значение, которое мы пытаемся присвоить. Например: 


зир 5ТОВЕ { 
ту($%е1#, $1п4ех, $уае) = @ ; 
1Ғ ($1пдех > $зе11->{В00№0} ) { 
сопғеѕѕ “Аггау 008: $іпдех > $е1#->{ВООМ№0}"; 
} 
гетигп $ѕе1ғ-> {АТА} [$1п4ех] = $уа1ие; 
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ЗЕШЕ->ИМТТЕ 


Этот метод вызывается подпрограммой ип 1е. В данном примере он не потребо- 
вался. См. предупреждение в разделе «Неочевидная ловушка при отвязыва- 
нии» ниже. 


ЅЕГЕ->0ЕЅТАОҮ 


Ре вызывает этот метод, когда нужно уничтожить связанную переменную 
и освободить занимаемую ею память. Это почти никогда не требуется в языке 
со сборкой мусора, поэтому в данном примере мы этот метод опустим. 


ЗЕЁЕ->РЕТСНУТЕЕ 


Метод ЕЕТСНУТРЕ должен вернуть общее число элементов связанного массива, 
ассоциированного с $ЕІ Е. Это эквивалент вызова эса1аг(@аггау), который обыч- 
но дает $наггау + 1. 


ѕир РЕТСН17Е { 

пу $ѕе1# = ѕһћіҒТ; 

геїигп ѕса1аг @{$зе11->{ВАТА}}; 
} 


ЗЕЁЕ->ЗТОВЕЗТАЕ(СОИМТ) 


Этот метод устанавливает общее число элементов связанного массива, ассо- 
циированного с 5ЕЁЕ, равным СОМ. Если массив уменьшается, нужно удалить 
элементы за пределами СОТ. Если массив увеличиваехся, нужно добавить но- 
вые элементы с неопределенными значениями. Класс ВоипдедАггау также га- 
рантирует, что массив не выйдет за изначально установленные границы. 


$и6 ЭТОВЕЗТИЕ { 
пу ($зе1+, Фсоџпі) =@, 
і? ($соцп{ > $5е11->{800\0}) { 
сопѓеѕѕ “Аггау 008: Фсоипї > $зе1#->{800\0}"; 
} 
$#{$зе11->{БАТА}} = Фсоипт; 
} 


ЗЕЁШЕ->ЕХТЕМО(СОИМТ) 


С помощью метода ЕХТЕМ№ Рег! сообщает, что размер массива, вероятно, будет 
увеличен до СОЏ\№Т элементов. Благодаря этому можно выделить один непре- 
рывный участок памяти вместо множества маленьких. Поскольку объекты 
ВоипдедАггау имеют фиксированную верхнюю границу размера массива, мы не 
станем определять этот метод. 


ЅЕГР->ЕХІЅТӘ(ІЛрЕХ) 


Этот метод проверяет наличие элемента в позиции МЕХ связанного массива. 
В нашем классе ВоипдедАггау мы просто используем встроенную функцию ех1$1$, 
предварительно убедившись, что это не попытка заглянуть дальше фиксиро- 
ванной верхней границы. 


р ЕХІЅТЅ { 
пу ($зе1+, $1п4ех) = @. 
1Р ($1пдех > $ѕе1#->{ВО0М0)) { 
сопѓеѕѕ “Аггау 008: $іпдех > $е1#->{ВО0М№0? ; 
} 
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ехівіѕ $ѕе1ғ-> {АТА} [$1пдех], 
} 


ЗЕГЕ->БВЕТЕТЕ( ТМОЕХ) 


Метод ГЕІЕТЕ удаляет элемент в позиции ЈМЕХ из связанного массива ЕІ. 
В классе ВопдедАггау этот метод выглядит почти идентично ЕХІЅТ5, но это от- 
клонение от нормы. 


зир ОЕЁЕТЕ { 
пу ($5е1Р $іпдех) =@; 
ргіпї Ѕ1рЕнн ` аеІетіпо! \п”, 
1Е ($іпдех > $ѕе1#->{ВОЦМО}) { 
сопѓеѕѕ “Аггау 00В: $1пдех > $ѕе1ғ->{ВО0МО}"; 


} 
Че1ете $ѕе1ғ -> {ВАТА} [$1пдеху, 


} 


УЕГЕ->СЕАВ 


Метод вызывается, чтобы очистить массив, например, когда массиву присваи- 
вается список новых значений (или пустой список), но не тогда, когдё он пере- 
дается функции ипіеѓ. Поскольку очищенный ВоипдедАггау всегда удовлетворя- 
ет условию верхней границы, проверка здесь не нужна: 


ѕир СІЕАВ { 
пу $5е1е = ѕһіҒї; 
фѕе1ғ->{рАТА} = [1]; 
} 


Если присвоить массиву список, метод С ЕАН будет вызван. но он не получит 
список значений. Поэтому при таком нарушении верхней границы: 


{1е(@аггау, “Воипдеддггау”, 2); 
баггау = (1, 2, 3, 4), 


метод С1ЕАВ выполнится успешно. Исключительная ситуация возникнет при 
последующем вызове 5ТОВЕ. Операция присваивания один раз вызовет метод 
СІЕАА и четыре раза — метод ЅТОВЕ. 


ЅЕГР->РОЅН(/ 157) 


Этот метод добавляет в конец массива элементы из / 157. Вот как он может быть 
реализован в нашем классе ВоипдедАггау: 


зиб РИЅН { 
пу $5е1Ғ = ѕһіҒТ; 
1Е (@ + $#{$$е11->{БАТА}} > $ѕе1ғ->{ВО0М0}) { 
сопғеѕѕ "Попыткг протолкнуть слишком много элемен гоь” 


} 
ризн @{$зе1г->{БАТА}}, @_; 


} 


ЗЕЁЕ->УМЗНТЕТ(ЕТ$Т) 


Этот метод вставляет элементы / 157 в начало массива. Для нашего класса Во- 
ипдедАггау эта подпрограмма аналогична РУЗН. 
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ЅЕГЕ->РОР 


Метод РОР удаляет из массива последний элемент и возвращает его. Для Воџпа- 
едАггау это метод-однострочник: 


ѕир РОР { ту $ѕе1ғ = ѕһіЁТ; рор @{$56е1#->{0АТА}; } 
ЗЕЁШЕ->ЗНТЕТ 


Метод ЅНІҒТ удаляет из массива первый элемент и возвращает его. Для Воипд- 
еаАггау он аналогичен РОР. 


ЗЕЁР->ЗРИ ТСЕ(ОРЕЅЕТ. [ЕМбТН, 115Т) 


Этот метод позволяет сращивать массив 5ЕЁ Г. Для имитации $р11се — встроен- 
ной функции Ре! – аргумент ОРЕЅЕТ является необязательным, по умолчанию 
равным нулю, причем смещения с отрицательными значениями откладыва- 
ются от конца массива. Аргумент [ЕМСТН тоже должен быть необязательным 
и по умолчанию содержать длину оставшейся части массива. [157 может быть 
пустым. При правильной имитации встроенной функции метод должен воз- 
вращать список из [ЕМСТН элементов исходного массива, начиная с ОЕЕЗЕТ (т.е. 
список элементов, заменяемых на /15Т). 


Поскольку сращивание представляет собой достаточно сложную операцию, мы 
вообще не будем ее определять, а просто воспользуемся подпрограммой ЅРІІСЕ 
из модуля Пе: :Аггау, которая нам досталась в результате наследования Тіе::Аггау. 
При этом ЗРЫСЕ будет определена на основе других методов ВоипдедАггау, поэто- 
му проверка границ сохранится. 


Этим завершается наш класс Воипдеддггау. Он лишь немного искажает семантику 
массивов. Но мы можем сделать и лучше, и гораздо более экономно. 


Удобство обозначений 


Одним из замечательных свойств переменных является возможность их интерпо- 
ляции. Одним из не столь замечательных свойств функций является отсутствие 
возможности интерполяции. Связанный массив позволяет создать интерполиру- 
емую функцию. Допустим, необходимо вставить в строку случайные числа. Мож- 
но просто сказать: 


в! /иѕг/біп/рег1 

раскаде ВапдТитегр; 

ѕир ТТЕАВВАУ { 61е5$ \ту $ѕе1ғ } 
ѕир РЕТСН { іпї гапа $ [1] }; 


раскаде паіп; 
11е @гапа, "Вапдїптегр ; 
Ғог (1, 10, 100, 1000) { 
ргіпі "Случайным числом, меньшим $_, является $гапв[$_ ]\п” 
} 


фгапа[32] = 5; # Это отформатирует наш системный диск? 
Если запустить эту программу, она выведет: 


Случайным числом, меньшим 1, является 0 
Случайным числом, меньшим 10, является 3 
Случайным числом, меньшим 100, является 46 
Случайным числом, меньшим 10-#, является 755 
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Сап'Е 1осате оф]есф теїһоа "ЅТОВЕ” уза раскаде “ВапдТпфегр” аї Ғоо 1іпе 10. 
[Невозможно найти метод “ЗТОВЕ” объекта через пакет Вапаїпїегр" ] 


Как видите, нет большой беды, что мы даже не реализовали 5ТОВЕ. Просто, как 
обычно, возникает исключительная ситуация. 


Связывание хешей 


Класс, реализующий связанный хеш, должен определить восемь методов. Т1ЕНАЗН 
создает новые объекты. ҒЕТСН и ЭТОВЕ обеспечивают доступ к парам ключ/значе- 
ние. ЕХІЅТЅ проверяет присутствие ключа в хеше, а ОЕЕЕТЕ удаляет ключ вместе 
с его значением.! СТЕАВ очищает хеш, удаляя все пары ключ/значение. ЕТАЗТКЕУ 
и МЕХТКЕУ осуществляют обход пар ключ/значение при вызове кеуѕ, уа]1иез или еасћ. 
И как всегда, если нужно выполнить какие-то особые действия при удалении 
объекта, можно определить метод ОЕЗТВОУ. (Если вам кажется, что методов слиш- 
ком много, значит, вы невнимательно прочли последний раздел, посвященный 
массивам. Как бы там ни было, можете смело наследовать методы по умолчанию 
из стандартного модуля Гіе::Наѕћ, переопределяя только те, которые вас интересу- 
ют. Кроме того, Тіе::510Наѕћ предполагает, что реализация тоже является хешем.) 


Допустим, например, что нужно создать хеш, в котором при каждом присваива- 
нии значения ключу будет происходить не перезапись прежнего значения, а до- 
бавление нового значения в конец массива значений. То есть, когда вы говорите: 
$и{$к} = “один`, 
фи{$к} = “два”; 


на самом деле выполняется: 


риѕћ @{ $н{$к} }, “один”; 
ризи @{ $1{$к} }, "два" 


Это не очень сложная идея, поэтому модуль должен получиться очень простым. 
Если в качестве базового класса выбрать класс 1:е: 5*0Наѕћ, то так и будет. Вот 
класс Тіе::Аррепанаѕћ, который это реализует: 


раскаде Т1е: :АррепдНази* 

изе Тіе: :Наѕћ; 

сиг @ТЗА = ("Тіе: :5їанаѕћ"); 

зиб ЭТОВЕ { 
ту ($зе1Ё, $кеу, $уа1ие) = @ ; 
риѕћ @{$5е1#. >{Кеу}}, Фуа1ие; 

} 

1, 


Методы связывания хешей 


Вот пример интересного класса связанного хеша: он предоставляет хеш, в кото- 
ром содержатся ӣоі-файлы? конкретного пользователя (т.е. файлы. имена которых 


Напомним, что Рей различает ключи, отсутствующие в хеше, и ключи со значением 
ипдеѓ. Проверить эти две ситуации можно с помощью ехіѕіз и де{1пед соответственно. 


Иногда их называют скрытыми, потому что по умолчанию команда 15 не выводит их. — 
Прим. перев. 
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начинаются с точки, как принято именовать файлы настроек в ОМІХ). Вы обра- 
щаетесь к хешу, передавая в качестве индекса имя файла (без точки), и получаете 
содержимое соответствующего 40-файла. Например: 


изе 001Е11е$; 
сіе Ж0ої, ”РоїР11еѕ”; 
1Ё ( $00ї1{ргоғі1е} =- /МАМРАТН/ || 
$901{1091п} =- /МАМРАТН/ || 
фао+{сәһгср =- /МАМРАТН/ ) { 
ргіпїі “Кажется. вам нужно установить переменную МАМРАТН\п”; 


} 
Вот еще один способ использования нашего связанного класса: 


6 Третьим аргументом является имя пользователя, 
В к 90т-файлам которого мы привяжемся. 
тіе Жһіт, "РоєРі1еѕ”, “даетон“. 
Ғогеасһ $# (Кеуѕ Жһіт) { 
ргіпЕ? "дої-файл демона %$ имеет размер %0\п", $#. 1епдїһ $һіт{$#}; 
} 


В примере 0о1Е11ез мы реализуем объект как обычный хеш, содержащий не- 
сколько важных полей, из которых только поле {СОМТЕМТ$} содержит то. что поль- 
зователь считает хешем. Фактические поля объекта перечислены в табл. 14.1. 


Таблица 14.1. Поля объекта в примере Оо Цез 


Поле _| Содержание 

ИЗЕВ Владелец доё-файлов, представляемых объектом. 
НОМЕ Расположение этих 40{-файлов. 

СЕОВВЕВ Разрешено ли изменять и удалять эти 4оё-файлы. 


СОМТЕМТ$ Хеш имен ӣоі-файлов и отображений содержимого. 


Вот начало РоѓЕійеѕ.рт: 


раскаде ПотРі1еѕ; 


изе Сагр, 
ѕио мћомаѕі { (са11ег(1))[3] 
ту ФОЕВИСб = 0; 


ѕир дебид { $ОЕВИб = @ ? эт 1} 


В данном примере мы хотим иметь возможность включить вывод отладочной ин- 
формации, которая облегчит трассировку во время разработки, для чего устанав- 
ливаем переменную $0ЕВИС. Мы также поддерживаем удобную внутреннюю функ- 
цию для вывода предупреждений: мПомаз1 возвращает имя функции, вызвавшей 
текущую («дедушки» мһомаѕі). 
Вот методы связанного хеша 00ї1Р11е: 
СІ АЅЅМАМЕ->ТТЕНАЅН(/ 757) 

Конструктор 00їҒі1е5: 


ѕиб ТІЕНАЅН { 
/ $3 = 5піғ+; 
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ту $иѕег = 5һіҒЕ || $>, 
ту $0доЁдіг = ѕһіғЕ || ^"; 


сгоак “изаде: @4[ &мпомаѕі 1} [ЧЅЕВ [ООТОІАЈ1" іғ ё ; 


Физег = деїриџіа($иѕег) 1? Физег =- /7\0+$/; 
ту $91г = (оеїрипат($иѕег))[7] 

|| сгоак "@{ [8мпомаз1] }: по изег Физег” 
$Ч1г .= "/$аоТаіг” 1? $00ї0іг; 


ту $поде = { 
ЏЅЕЋ => Физег, 
НОМЕ => $аіг. 
СОМТЕМТ$ => {}, 
СІОВВЕВ => 0, 

}; 


орепд1г(ОТВ, $@іг) 
|| сгоак "@{[ёмһомаѕі]}: сап’® орепаіг $91г: $! "; 
Гог пу $401 ( дгер /^\./ &8 -Е "$91г/$_° геада= г(0тА)) { 
$001 =- $/^\. //; 
$поде->{СОМТЕМТ$} {$001} = ипаеЕ; 
} 
с1оѕедіг ПІВ; 


гесигп р1еѕѕ $поде, $5е1#; 
} 


Стоит, вероятно, отметить, что если мы собираемся применять проверки фай- 
лов к значениям, возвращаемым геао01г, следует добавлять перед ними соот- 
вегствующий каталог (как мы и делаем). Иначе, без вызова сһііг, может ока- 
заться, что проверяется не тот файл. 


ЗЕЁЕ->РЕТСН(КЕУ) 


Этот метод реализует чтение элемента из связанного хеша. Помимо ссылки на 
объект он принимает один аргумент: ключ, значение которого мы хотим полу- 
чить. Ключ является строкой, и с ним можно делать все, что можно делать со 
строкой. 


Вот пример извлечения значения элемента для нашего 00*[11е5: 


10 РЕТСН { 
сагр ёмһомаѕі 1іҒ $ОЕВИС; 
пу $зе1 = =һі?; 
ту $001 = ЗВ РЕ; 
пу $091г = $%561#-> {НОМЕ} 
пу $#і1е = "$01г/. $001”; 


џп1еѕѕ (ехіѕіз фѕе1ғ->{СОМТЕМТ}->{ $001} || -# $Ғ11е) { 
сагр "@{[8мһомаѕі]}: по $@0ї #11е” 1? $РЕВОС; 
гефигп ипаеғ; 

} 


# Реализовать кэш. 
1? (деғіпеа $ѕе1ғ#->{СОМТЕМ }->{$аот}) { 
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гефигп $ѕе1ғ- 2 {СОМТЕМТЅ } -> {$001}, 


} е1ѕе { 


гетигп $ѕе1ғ->{СОМТЕМТ }-> {$01} = `саї $01 г/. $001 `; 


Мы немного схитрили, выполнив команду ОМІХ са К) но более переносимой 
(и более эффективной) была бы реализация, самостоятельно открывающая 
файл и выполняющая его чтение. С другой стороны, поскольку іоі-файлы яв- 
ляются особенностью ОМХ, мы не очень этим озабочены. Или не должны 
быть озабочены. Или что-то в таком духе... 


ЗЕЁЕ->ЗТОВЕ(КЕУ, МАШЕ) 


Этот метод выполняет всю черную работу при установке (записи) элемента 
в связанном хеше. Помимо ссылки на объект он принимает два аргумента: 
ключ и новое значение. 


В нашем примере 001ЁЕ11ез мы разрешим пользователям перезаписать файл 
лишь после вызова метода с1оррег с исходным объектом, полученным от 11е; 


ѕир ЅТОВЕ { 
сагр 8мпомаз1 1Е $0ЕВЏС; 
пу $521 = 5һіҒТ; 
му $901 ЗАТ ЕЕ; 
ту $уа1ие = 5һћіҒ+; 
пу $Ее = $5е1е->{НОМЕ} . "/. $001"; 


и 


сгоак “@{[&мпомаз1 ]}: $Е11е невозможно перезаписать" 
ип1еѕ5 $5е1#-> {СІ ОВВЕЋ}; 

ореп(Е, "> $ғі1е") || сгоак “не могу открыть $#і1е: $!” 

ргіпі Е $уаше; 

с1оѕе(Е); || сгоак "не могу закрыть $#і1е: $! 


} 
Если кому-то потребуется изменить файл, можно сказать: 


фоб = {1е Ждаетоп_йоїѕ, ‘даетоп” 
$ор->с10ббег(1); 
$дбаетоп_доїѕ{ ѕідпаїџге} = “Настоящий демон\п”; 


Другим вариантом является установка {СІ ОВВЕВ; посредством 11е0: 


тіе %даетоп_ доїѕ, "РотЕі1еѕ”, “даетоп” 
тіед(%даетоп_доѕ)->с10обЫег(1); 


или в одну команду: 
(1іє %ааепоп_доїѕ, “Бо{Р11е3”, "даепоп”)->с1обоег(1); 
Метод с1орбег определяется просто: 


зиб сЈорбег { 
му $ѕе1? = ѕһћіғї; 
фѕе1г->{С-ЯВВЕҢ} = @ ? 5һіҒі : 1; 
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ЗЕЁЕ->ВЕТЕТЕ(КЕУ) 


Этот метод обрабатывает запросы на удаление элемента иг хеша. Если ваш 
эмулированный хеш использует настоящий хеш, можете вызвать настоящую 
функцию де1ете. Кроме того, мы постараемся проверить, действительно ли 
пользователь хочет уничтожить файл: 


эиб БЕЕЕТЕ { 


} 


сагр ёмһомаѕі 1 ФЕВИС; 
ту $ѕе1? = ѕһі#, 
ту $00 = 5һћЇРЕ; 
пу $Ее = $5е1ғ-> {НОМЕ . "/. $001"; 
сгоак "@{[&иһомаѕі]}. не стану удалять файл $#і1е" 
ип1еѕѕ $ѕе1#->{СІОВВЕВ); 
де1ете $5е1ғ->{СОМТЕМ№І 5 }->{ $01}; 
ип1інк $Ғ1Је || сагр "@{[&мћомаѕі]} не могу удалить $%Ғі1е: $! “: 


ЗЕЁЕ->СЬЕАН 


Этот метод вызывается, когда нужно полностью очистить хеш, обычно в слу- 
чае присваивания ему пустого списка. В нашем примере при этом удаляютсн 
все 40%-файлы пользователя! Это настолько опасно, что мы потребуем, чтобы 
значение (1 0ВВЕВ было больше 1, прежде чем выполнить это действие: 


зи СІЕАВ { 


} 


сагр &мпомаз1 іѓ ФРЕВЏС; 

пу $5е1? = ѕһіҒ+; 

сгоак "@{[8мһомаѕ1]}: не буду удалять все дої-файлы $ѕе1#-> {ЏЅЕВ}` 
ип1ез$ $ѕе1#- > {СІ.ОВВЕВ} > 1; 

Ғог ту $401 ( Кеуѕ %{$зе17->{СОМТЕМТ$}}) { 
$зе11->ОЕГЕТЕ( $401); 

} 


ЗЕЁЕ->ЕХТУТЗ(КЕУ) 


Этот метод запускается при вызове пользователем функции ехіѕїѕ с данным 
хешем. В нашем примере мы будем искать ответ в элементе хеша {СОМТЕМТ$}: 


ѕир ЕХІЅТЅ { 


} 


сагр ёмһомаѕі 1# $ПЕВУС; 

ту $ѕе1ғ = ѕһіғї` 

пу $00 = $1111; 

гефигп ехіѕтѕ $5е1{#->{СОМТЕМТ$}->{$401} 


ЗЕЁЕ->ЕТВУТКЕУ 


Этот метод вызывается, когда пользователь начинает обход хеша, например, 
при вызове Кеуз, уа1иез или еасн. В результате вызова кеуѕ в скалярном контек- 
сте мы сбрасываем внутреннее состояние, чтобы очередной вызов еасй в инст- 
рукции гефигп возвращал первый ключ. 


ѕир ЕТАЗТКЕУ { 


сагр &мпомаз1 1Е $0ЕВИС; 
ту $ѕе1ғ = ѕһіғ+; 
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пу $Тетр = кеуѕ %{$5е1#-> {СОМТЕМТЅ} } 
гетигп ѕса1аг еасһ %{$$е11->{СОМТЕМТ$} } 
} 


ЅЕІ Е->МЕХТКЕҮ(РАЕҰКЕҮ) 


Этот метод служит итератором для функций Кеуз, уа1иеѕ или васһ. РВЕУКЕУ яв- 
ляется последним запрошенным ключом и предоставляется Ре]. Это удобно, 
если методу МЕХТКЕУ нужно знать свое предыдущее состояние для вычисления 
последующего. 


В нашем примере для представления данных связанного хеша используется 
настоящий хеш, только этот хеш хранится в поле СОМТЕМТ$ хеша, а не в самом 
хеше. Поэтому мы можем просто положиться на итератор еасћ: 


ѕир МЕХТКЕУ { 

сагр ёмћомаѕі і? ФОЕВИС; 

ту $ѕе1# = ѕһі?ї; 

гетигп зса1аг еасһ %{ $зе1#->{СОМТЕМТ$} } 
} 


ЗЕЁРЕ->ИМТТЕ 


Этот метод вызывается подпрограммой ип]е. В этом примере он не нужен. 
См. предупреждение в разделе «Неочевидная ловушка при отвязывании». 


ЅЕГР->рЕЅТВОҮ 


Этот метод вызывается, когда объект связанного хеша должен быть удален из 
памяти. Практической нужды в нем нет, кроме как для отладки и дополни- 
тельной подчистки. Вот очень простой вариант: 


зир РЕЅТВОҮ { 
сагр 8мПоиа$1 1 $0ЕВИС; 
} 


Теперь, когда мы показали все эти методы, вот вам домашнее задание: вернуться 
назад, найти все точки интерполяции @ќ{[&нћомаѕ1]) и заменить их простым свя- 
занным скаляром с именем $мһоҝаѕі, осуществляющим то же самое. 


Связывание дескрипторов файлов 


Класс, реализующий связанный дескриптор файла, должен определить следую- 
щие методы: ТІЕНАМІЕ и по крайней мере один из РВІКТ, РВІМТЕ, ИВІТЕ, ВЕАРІІМЕ, СЕТС 
и НЕАО. Класс может также предоставить метод ОЕЗТНОУ и методы ВІММОрЕ, ОРЕМ, 
СІ08Е, ЕОЕ, ЕТЬЕЮ, ЅЕЕК, ТЕШ, ВЕАВ и ИВТЕ, чтобы разрешить применение соответст- 
вующих встроенных функций. (А если говорить более точно, то ИВТТЕ соответст- 
вует зузмг Це и не имеет никакого отношения к встроенной функции мг Те для вы- 
вода со спецификациями форматирования.) 


Связанные дескрипторы файлов особенно удобны, когда Рег! встраивается в дру- 
гую программу (например, Арасће или #7) и вывод в 570007 или 5ТОЕНЯ требуется 
перенаправлять особым образом. 


Однако дескрипторы файлов совсем не обязательно связывать с файлами. Инст- 
рукции вывода можно использовать для создания структур данных в памяти, 
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а команды ввода — для чтения их в программе. Вот простой способ обратить поря- 
док следования вызовов ргіпї и ргіпі?, не меняя при этом местами отдельные 
строчки: 


раскаде ВеуегѕеРгіпї 0.01 { 
иѕе ѕїгісї; 
ѕиб ТІЕНАМОІЕ { 
пу $с1аъ> = эВ ЕЕ; 
біеѕѕ [], $с1азз; 


} 
ѕир РАТМТ { 

ту $ѕе1# = ѕһіғї; 

риъй @фъе1ғ, јоіп("" => @ ); 
} 


зио РАТМЕ { 
пу $5е1# = эВ ЕЕ, 
пу ФЁпЕ = зп РЕ; 
риѕһ @фѕе1ғ, ѕргіпі?($#пі. @_); 


ѕир ВЕАРІІМЕ { 
пу $е1# = ѕһіғі, 
рор @%ф5е1#; 


} 


ту фт = “--МОВЕ--\п”; 
їіе *ВЕМ, "ВемегѕеРгіпі" 


# Выполнить несколько рг1пї и ргіпї#. 
огіпі НЕУ "Тһе Ғох 1$ пом деаа. $т"; 


ргіптҒ ВЕМ <<"ЕМО", 1пт гапа 10000000; 
Тһе аоіск ргомп Ғох јитрѕ 

оуег їһе 1ағу дод Жа їітеѕ! 

ЕМО 


ргіпі АЕУ <<“ЕМО"; 

Тһе диіск Бгомп Рох јитрѕ 
омег Їһе 1ағу 009. 

ЕМО 


# Теперь обратное чтение из того же дескриптора 
рг1пі мті1е <ВЕМ>; 


В результате будет выведено: 


тһе дилск бргомп Ғох јитрѕ 

омег їпе 1ағу 909. 

Тһе даџіск бгомп Ғох јипрэ 

омег Тһе Тату дод 3179357 11тез! 
Тре Гох 1$ пом аеад. --МОВЕ-- 
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Методы привязки дескрипторов файлов 


В качестве примера посложнее создадим дескриптор файла, преобразующий вы- 
водимые строки в верхний регистр. Исключительно для собственного удовольст- 
вия мы будем начинать файл тегом <5Н001 при его открытии и заканчивать его 
тегом </ЗНОУТ> при закрытии. Благодаря этому мы можем выражаться на кор- 
ректном (ме|-Фогтед) языке ХМІ.. 


Вот начало файла бйои!.рт с реализацией класса: 


раскаде Ѕһоџї; 
изе Сагр: # Чтобы выводить ошибки посредством сгоак 


Теперь перечислим определения методов в Ѕћоиѓ.рт. 
СІ АСОМАМЕ->ТТЕНАМОІЕ(/ 757) 


Это конструктор класса, возвращающий ссылку, как обычно, обработанную 
функцией 01еѕ5. 


ѕир ТІЕНАМОІЕ { 
пу $С1а55 = Ѕћ1ҒЁ; 
ту ФҒогт = =ћ1#+; 
ореп(ту $ѕе1ғ, ФҒогт, @ ) || сгоак “не могу открыть $Рогт@_: $!°, 
і? ($Ғогт =- />/) { 
ргіпі $ѕе1# “<НО0Т>\п”; 
ффѕе1ғ->{МВІТІМ} = 1: # Не забыть вывести закрывающий гег 
} 
гефигп 01еѕѕ $зе1Р, $с1а55; й $5е1{ является ссылкой на 9100 


} 


Здесь мы открываем новый дескриптор файла в соответствии с режимом 
и именем файла, переданными оператору {1е, выводим в файл <5Н007 и воз- 
вращаем ссылку на него, обработанную функцией 0105. В вызове ореп проис- 
ходит много интересного, но мы отметим лишь, что в дополнение к обычной 
идиоме «орер ог діе» в аргументе пу $5е11 функции ореп передается неопреде- 
ленный скаляр, который ореп умеет автовивифицировать в &уреё10Ъ. Тот факт, 
что это бурей]юЪ, тоже важен, потому что іуреғ1оЬ содержит не только дейст- 
вительный объект ввода/вывода файла, но и другие удобные (и бесплатные, 
с точки зрения реализации) структуры данных, например, скаляр ($$$5е17), 
массив (@$$561#) и хеш (%$$5е11). (Не говоря уже о подпрограмме, &$$5е1 1.) 


$ғогт является аргументом, содержащим имя файла или режим. Если это имя 
файла, то массив @ пуст, и выполняется вызов орег с двумя аргументами. 
В противном случае $їогп указывает режим для остальных аргументов. 


После вызова ореп проверяется, нужно ли выводить открывающий тег. Если 
да, то мы это делаем. И сразу после этого используем одну из упомянутых вы- 
ше глобальных структур данных. Выражение $$5е11->{ИВТТТ№МС} служит приме- 
ром использования глобальных переменных для хранения интересной инфор- 
мации. В данном случае мы запоминаем, выводился ли открывающий тег, 
чтобы знать, нужно ли выводить соответствующий закрывающий тег. Мы ис- 
пользуем хеш %$$е1#, чтобы дать полю приличествующее имя. Можно было 
бы использовать скаляр $$$561, но это не было бы самодокументацией. (Или 
было бы только само (зе {) документацией, в зависимости от того, как на это 
посмотреть.) 
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ЗЕЁЕ->РАТМТ(ЕТ5Т) 


Реализует вывод в связанный дескриптор. [157 содержит все, что передается 
функции ргіпї. В нашем методе все элементы списка / 157 переводятся в верх- 
ний регистр: 


ѕио РВІМТ { 

пу фѕе1# = эн; 

ргіпі $5е1ғ тар {ис} @_; 
} 


ЅЕГЕ->ВЕАрІІМЕ 


Этот метод возвращает данные, когда чтение из дескриптора осуществляется 
через оператор угловых скобок (<ЕН>) или геад1іпе. Метод должен возвращать 
опдег, если данных больше нет. 


ѕир ВЕАРЕІМЕ { 
пу $ѕе1# = ѕһћіғт; 
геёигп <$5е1ғ>; 


} 


Здесь мы просто возвращаем <$501?>, чтобы метод вел себя должным образом 
при вызове в скалярном или списочном контексте. 


ЗЕЁЕ->СЕТС 


Этот метод вызывается, когда к связанному дескриптору файла применяется 
деїс. 


ѕиб СЕТС { 
пу $зе1е = ѕћіғ+; 
гетигп деёс($е1#); 
} 


Как и некоторые другие методы нашего класса 5ћоџї, метод бЕТС просто вызы- 
вает соответствующую встроенную функцию и возвращает результат 


ЗЕЁЕ->ОРЕМ(ЕТ$Т) 
Наш метод ТТЕНАМОЕЕ открывает файл самостоятельно, но программа, исполь- 


зующая класс 5ћоџї и вызывающая при этом ореп, реально вызывает вот этот 
метод. 


ѕир ОРЕМ { 
пу $5е1Ғ = ѕһіғ+; 
ту ФҒогт = =һіҒЕ; 


пу $пате = "ФҒогт@ “; 
$5е1?->С105Е; 


ореп(%ѕе1ғ, $Рогт, @ ) || сгоак '` невозможно вновь открыть $пате: $! "; 
1# ($Ғогт =- />/) { 
ргіпї $ѕе1ғ# "<5НОШТ>\п” || сгоак "невозможно начать вывод: $! “, 
$ф561?->{ИВІТІМ)} = 1; # Не забыть вывести закрывающий тег 
} 
е15е { 


ффее1ғ->{МВІТІМ№)} = 0; # Не выводить закрывающий тег 
} 


геїигп 1; 
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Мы вызываем собственный метод (10$Е, чтобы явно закрыть файл, сели поль- 
зователь об этом не позаботился. Затем открываем новый файл с именем, ука- 
занным в ореп, и выводим в него открывающий тег, если необходимо. 


ЅЕГЕ->С08Е 


Этот метод обрабатывает запрос на закрытие файла. Мы ищем конец файла 
и в случае успеха выводим </ЗНОЦТ>, а затем вызываем встроенную функцию 
с103е. 


зи СЕОЗЕ { 
пу $ѕе1# = ѕһіҒї; 
іЁР ($%%5е1ғ->{МВІТІМ№)}) { 
фѕе1#->ЅЕЕК(0, 2) || гефиги; 
фѕе1#- >РВІМТ( “</ЗНОиТ>\ п”) || гетигп; 
} 
геїигп с1оѕе $зе1Е; 
} 


ЅЕГЕ->ЅЕЕК(1ІЅТ) 


При передаче связанного дескриизора файла функции зееК вызывается метод 
ЗЕЕК. 


5и6 ЅЕЕК { 

ту $зе1Г = ЅһЇҒї; 

ту (ФоРЕзет, $мпепсе) = @_, 

гефигп зеек($зе1+, $оРРзеЕ Фиһепсе); 
} 


ЅЕГЕ->ТЕШ. 
Вызывается при передаче связанного дескриптора файла функции {е11. 


$и6 ТЕЦ. { 
пу $5е1ғ = ЅһіҒі; 
гетигп 1е11 $ѕе1т; 
} 


ЗЕЁЕ->РАТМТЕ(ЕТ$Т) 


Вызывается при передаче связанного дескриптора файла функции ргіпїї. 
Список [157 содержит формат и элементы, подлежащие выводу. 


ѕир РВІМТЕ { 

ту $$е1Р = ѕп1її; 

ту $ёетр1аїе = зһіғі; 

геигп $5ѕе1ғ->РАІМ(ѕргіпі? $етр1аїе, @ ); 
} 


Здесь мы применяем ѕргіпїї для генерации форматированной строки и пере- 
дачи ее РВІМТ для перевода в верхний регистр. Однако использовать встроен- 
ную функцию ѕргіпі не обязательно. Можно предусмотреть собственную ин- 
терпретацию спецификаторов формата, начинающихся символом процента. 


ЗЕЁЕ->ВЕАВ(ЕТ5Т) 
Отвечает за выполнение операции чтения при вызове геай или зузгеад. Обрати- 


те внимание, что мы модифицируем первый аргумент [.15Т «по месту», имити- 
руя способность геай заполнять скаляр, передаваемый во втором аргументе. 
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зи ВЕАВ { 

ту ($зе1е, ипде?, $Лепд+в, $о|Рзет) = @ ; 

пу $биғгеғ? = \$_[1]; 

геїигп геаа(фѕе1ғ, $%0иғгеғ, Ф1епотп, $о?Ғѕеї); 
} 


ЗЕТЕ->МВТТЕ(Е 15Т) 


Вызывается при записи в дескриптор с помощью ѕуѕиг1їе. Здесь мы преобразу- 
ем символы записываемой строки в верхний регистр. 


50б МАІТЕ { 
пу $ѕе1# = ѕһіғї; 
пу Фѕігіпо = ис(5п1ҒЁ); 
ту $1епоїһ = ѕһі?т || 1епоен $3%г1пд; 
пу $о?ёѕеї = ѕһі?Е || 0; 
гефигп ѕуѕмгіте $%5е1ғ, Фә1гіпс̧, $1епоіһ, $о?ғѕеї; 


} 
ЅЕГЕ->ЕОЕ 


Возвращает булево значение, когда дескриптор файла, связанный с классом 
Ѕһоиї, проверяется на состояние конца файла посредством еоѓ. 


5Ѕир БОЕ { 
пу $5е1# = ѕһіғ+; 
геигп ео? $е1#; 
} 


ХЕТ Р->ВІММОРЕ(ТОГАҮЕЋ) 


Определяет уровень ввода/вывода для использования с дескриптором файла. 
Когда уровень не задан, дескриптор файла переводится в двоичный режим 
(уровень :гаһ), если файловая система различает текстовые и двоичные файлы. 


зи ВІММОВЕ { 
пу $3е1е = ѕһіті; 
пу Фдіѕс = НЕЕ || ": гам", 
гефигп біптоде $зе1Е, $015с; 


} 


Так следовало бы написать, но в нашем случае это бесполезно, поскольку 
функция ореп уже произвела запись в дескриптор. Поэтому в данном случае 
следовало бы, вероятно, сказать: 


зи ВІММОРЕ { сгоак( "Слишком поздно использовать 61птоде”) } 


ЗЕРЕ->ЕИ-ЕМО 


Этот метод должен возвращать дескриптор файла (Г11епо), ассоциированный 
операционной системой со связанным дескриптором файла. 


ѕ5ир ЕПЕМ№ { 
ту $561# = ЅҺіҒї; 
геёигп Е11епо $$е1#; 
} 


ЗЕ Е->ОМТТЕ 


Вызывается подпрограммой ипЧе. В данном примере он не потребовался. 
См. предупреждение в разделе «Неочевидная ловушка при отвязывании». 


488 Глава 14. Связанные переменные 


ЗЕЁЕ- >ОЕЗТВОУ 


Как и в других типах связывания, этот метод вызывается, когда связанный 
объект должен быть уничтожен. Он позволяет объекту прибрать за собой. 
Здесь мы закрываем файл, если программа забыла его закрыть. Мы могли бы 
просто сказать с1056 $зе1т, но лучше вызвать метод класса (С105Е. Тогда, если 
разработчик класса решит изменить способ закрытия файлов. этот метод 
рЕЅТАОҮ не придется модифицировать. 


ѕир ОЕЗТНОУ { 

ту $561? = ЅһіҒї; 

фѕе1Ғ->С108Е; # Закрыть файл с помощью метода СЕОЗЕ класса Ѕћоџ+ 
} 


Вот демонстрация класса Ѕћошт: 


#1 /иѕі /бтп/рег 1 
зе Зроит, 
11е(*РО0, Ѕһоиї.:, “>Еепате“); 


ргіпї РОО `пе11о\п”; Выведет НЕЦ.0. 

ѕеек РОО, 0, 0, Переход в начало файла 
@1іпеѕ = <РОО>; Вызовет метод НЕАПЕТМЕ 
с1оѕе 200; Закрыть файл явно. 


ореп(ғ00, “+<“, "Ғі1епате"); 
ѕеек(ғ00, 8, 0); 
зузгеаа(ғ00, $іпби?, 5); 
ргіп? “Роипа $іпбиж\п” 
ѕеек(ғОО, -5, 1); 
зузигЦе(Р00, "сіао! \п", 6); 
ипі1е( +00); 


Повторно открыть РОО, вызвав ОРЕМ 
Перешагнуть через “<5НОЦТ>\п” 
Прочитать 5 байтоғ из ЕОО в $іприё 
Должен вывести” һе110”. 

Вернуться назад к началу "ће110”. 
Записать 6 байтов в РОО 

Неявно вызовет метод СІ 0ЅЕ. 


ЕЕЕ 36-3 


После выполнения этого фрагмента файл будет содержать: 


<5НО0Т> 
СТАО! 
</5НОШТ> 


Вот еще некоторые странные и удивительные вещи, относящиеся к этой внутрен- 
ней глобальной переменной. Мы используем тот же хеш, что и раньше, но с новы- 
ми ключами РАГНМАМЕ и 0ЕВуб. Сначала перегрузим операцию преобразования 
в строку, чтобы при выводе наших объектов отображался путь (см. главу 18): 


# Ну, это круто! 
иѕе оуег1оаа 4(^”) => ѕио { % [0]->раїћпапте } 


# Это заглушка для добавления во все трассируемые функции 
ѕиб Ёгасе { 

ту $ѕе1# = ѕһіті; 

10са1 $Сагр: :Сагрееме] = 1; 

Сагр: :с1иск("\пігасе тадіса1 пеїћой") 1? $$е1#->дерид; 
} 


# Перегрузка обработчика для вывода пути. 
$16 ратпламе { 
пу $3е1# = =һіЁї; 
сопѓеѕѕ "я не метод класса” ип1езз геѓ $561; 
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} 


$$5е1+1->{РАТНМАМЕ} = $П11т і? @; 
гетигп $$зе11-> {РАТНМАМЕ} · 


# Два режима. 
зиб дерид { 


} 


А затем будем вызывать ігасе при входе во все обычные методы, например: 


ту $зе1Р = Зһіғї; 

пу $\аг = ге? $зе1Е ? \$$5е1+->{0ЕВИб} Хоџг $0ебид; 
ффуаг = ѕһіғі і? @ ; 

гефигп ге? $ѕе1ғ ? $%ѕе1ғ->{ПЕВОС} || $%0ерид : $ребид; 


ѕир СЕТС { $ [0]->тгасе; # НОВИНКА 


} 


ту(фѕе1ғ) =@; 
де1с($зе11); 


А также сохраним строку пути в ТТЕНАМОЕЕ и ОРЕМ: 
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$6 


} 


ТІЕНАМ№ОІЕ { 

ту $61а$$ = $11; 

пу Фогт ЗһіҒЇЕ; 

пу пате = “$Роги@_”: # НОВИНКА 


ореп(ту Фѕе1ғ, $Роги, @ ) || сгоак "невозможно открыть фпате $! "; 


ТЕ ($Рогм =- />/) { 

рг1пЕ $зе1Р "<5НОШТ>\п”; 

$$зе1#->{ИАТТТА6} = 1; # Не забыть вывести конечный тег 
} 
Ь1езз $ѕе1ғ, $с1азз; н ФЕН является ссылкой на 9106 
$5601?->раїћпате( $папе), # НОВИНКА 
гетигп $5е1#; 


ОРЕМ { $_[0]->Егасе; # НОВИНКА 

ту $зе1Р = зна те; 

ту фѓогт = зћіғї; 

пу Фпаме = “$РГогп@_ 

$561#->СІ08Е; 

ореп(%ѕе1#, $Ғогп, @_) сгоак чевозможно вновь сткдьть. $ 
фѕе1І+->раїһпате(фпате):; # НОВИНКА 

1? ($Рогт =- />/) { 


ргіпі($зеїғ "<ЅНОЏТ>\п") || сгоак "невозможно начать вывод: $! 


ффзеїҒ->{ИАІТІМ№) = 1; # Не забыть вывести конечный тег 


} 
е156 { 


фф561ғ->{МВІТІМ} = 0; # Запомнить, что не нужно выводить конечный тег 


} 


гефигп 1; 
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Где-то нужно также вызвать $501ѓ->ерио(1) для включения отладки. После этого 
все вызовы Сагр::с1иск будут выводить осмысленные сообщения. Ниже показано, 
что мы получим при повторном открытии файла выше. Здесь видно, что мы опус- 
тились на три уровня вложенности при закрытии старого файла и подготовке 
к открытию нового: 
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їгасе тадіса1 пеїћод аї Ғоо 11пе 87 
Ѕһоиё: : ЗЕЕК( `>#і1епате`, `>?іЛепате`, 0, 2) са11еа ат ?оо 11пе 81 
Ѕһоот : : СЕОЗЕ( ">#і1епате') са11еа аї Ғоо 1іпе 65 
Ѕһои: :ОРЕМ( `>Ғі1епапе , '`+<`, '`Ғі1епате’) саі1ео аї Ғоо 1іпе 141 


Созидающие дескрипторы файлов 


Один и тот же дескриптор файла может быть связан как со вводом, так и с выво- 
дом двунаправленного канала. Допустим, вы хотите запустить программу 6с(1) 
(калькулятор произвольной точности) таким способом: 


иѕе Тіе: :0реп2; 


їіе *САІС, “Пе: :Ореп2", "рс -1” 
$зит = 2; 
Ғог (1..7) { 
ргіпі САС “Феит + $зит\п“; 
$ѕит = <САЕС>; 
ріп "$. $ѕит”: 
сһотр Фѕит; 
} 
с1оье САС; 


Можно предположить, что будет выведено следующее: 


4 

16 

256 

65536 

429496 /296 

18446744073709551616 
340282366920938463463374607431768211456 


У с ст һо № 


Ожидания оправданные, будь на компьютере программа 6с(1) и определи мы 
Тіе::0реп2 так, как описано ниже. На этот раз в качестве внутреннего объектг бу- 
дет использоваться массив. Он содержит два фактических файловых дескрипто- 
ра для чтения и записи. (Черную работу открытия двунаправленного канала вы- 
полняет метод 1РС::0реп2; мы занимаемся только приятными вещами ) 


раскаде Тіе: :Ореп2; 

иѕе 5їгісї; 

изе Сагр; 

изе Тіе: : Напа] е; # не наследуйте этот класс! 
иѕе ТРС: :Ореп2; 


$иб ТІЕНАМОЕ { 
пу ($с1азз, @ста) = @ : 
по магпіпоѕ “опсе”, 
пу @ёһраіг = \до { 1оса1(*АОВ, »*МТА) }; 
р1еѕѕ $, "Тіе: :51ідНапа1е" Рог @ѓһраіг; 
р1еѕѕ(\@ѓһраіг => $с1азз)->ОРЕМ(@ста) || 91е; 
гетигп \@Рвратг; 
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500 


500 


Тог 


Гог 


Рог 


Тог 


} 
1; 


ОРЕМ { 

ту ($5е1ғ, @ста) = @ ; 

фѕе1ғ->С108Е 1# дгер {деҒіпеа} @{ $ѕе1?->ЕІІЕКО } 
ореп2(@фѕе1Ғ, @ста); 


ЕТЕЕМО { 
пу $5е1# = ѕпіёї; 
[ тар { ?і1епо $5е1#->[$ ] ) 0,1 1]; 


ту Фоифтети ( ом(РВІМТ РАТМТЕ МАТТЕ) ) { 
по $ЕгасЕ "геғѕ”; 
*Фоиттетв = зи6 { 
ту $5е1е = ѕһіҒЕ; 
$5е1е->[1]->Фоиметн(@_): 
}, 


ту $1птети ( дм(НЕАО ВЕАОЕТМЕ СЕТС) ) { 
по 5Ег1ісї “ге”; 
*фіптеїб = зи6 { 
ту $561? = ЅһЇҒТ; 
фве1ғ->[0]->фіпме+һ(@ ); 
}, 


ту $дорре1теїп ( дм(вІММОрЕ С10ЗЕ ЕОЕ)) { 
по ѕігісї "геїѕ”; 
*фдорре1теїћ = вир { 
пу $ѕе1# = ѕһіҒ; 
фѕе1#->[0] >$@орре1теһ(©_) 8& $ѕе1ғ->[1]->$аорре1теїһ(@ _), 
}; 


ту $деадтетн ( ом(ЗЕЕК ТЕШ.)) { 
по гісі "геғѕ”; 
*фдеадтеёћ = ѕир { 
сгоак(”сап”ф $деадтетн а ріре”); 
} 


Последние четыре цикла, по нашему мнению, просто чрезвычайно элегантны. За 
разъяснением происходящего вернитесь к разделу «Замыкания в качестве шаб- 
лонов функций» главы 8. 


Вот еще более безумный набор классов. Имена пакетов подскажут, для чего эти 
классы служат. 


иѕе 


Ѕїгісі; 


раскаде Тіе: : Веућ№и11; 


зи6 ТІЕНАМ№МІЕ { 
ту $с1аѕ8 = 5һћіғЕ; 
пу $#ђ = 1оса1 *ЕН; 
Б1еѕѕ \$#һ, $с1а55; 
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Рог (ам(ВЕАО ВЕАБЕТМЕ СЕТС РАТМТ РВІМТЕ ИВТТЕ)) { 
по ѕігісї "геғѕ” 
*$_ = ѕиб { геїишгп }; 


} 


раскаде Тіе: : ремВапаӣоп; 


ѕир ВЕАРІІМЕ { гапа() . “\п”, } 
ѕир ТІЕНАМІЕ { 

пу $с1а55 = $11; 

ту ФЕВ = 1оса1 «РЕН; 

р1еѕѕ \$Ғһ, $с1а$$; 


ѕир ЕЕТСН { гапа() } 
ѕию ТТЕЗСАЁАЯ { 
ту $с1а55 = ЅһЇҒ; 
01е55 \ту $ѕе1#, $с1а55; 


раскаде Тіе: :Тее; 


ѕир ТТЕНАМО!Е { 

ту $с1а5= = ЅһіҒЕ; 

ту @Папо1ез; 

Рог ту Фрати (@_) { 
ореп(ту $#һ, ">$раһ") || діе “невозможно вывести в $раїћ”; 
риѕћ @папд1ез, $11; 

} 

р1еѕѕ \@һапа1еѕ, $с1азз; 


ѕир РВТМТ { 
ту $ѕе1# = 5һіҒЕ, 
пу Фок = 0; 
Рог ту $#һ (@фѕе1#) { 
$ок += ргіпі $#һ Ө, 
} 
гефигп Фок == @$зе1+ 
} 


Класс Тіе: Тее эмулирует стандартную программу ОМХ ѓее(1), которая отнравля- 
ет один выходной поток по нескольким различным адресам. Класс Тіе::Пеући11 
эмулирует устройство /4ео/пий в ОМІХ-системах. А класс Т1е: :ОеуНапдот создает 
случайные числа в виде дескриптора файла или скаляра, в зависимости от того, 
вызываете вы ТІЕНАМІЕ или ТТЕЗСА! АВ! Вот как осуществляется обращение к ним: 


раскаде паіп; 


іе «ЅСАТТЕВ, "Тіе::Тее", дм(ітр1 - їтр2 >+тр3 їтр4); 
11е *ВАМООМ, "Тіе: : ремВапдот”; 

їе «М, “Пе: : ремћи11“ 

їіе пу $гапду, “Т1е: : реуВапдот"; 
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Рог ту $1 (1..10) { 
ту $1іпе = <ВАМООМ>: 
сһотр $11пе; 
Тог ту Ф#һ (+МАЫ, +5САТТЕВ) { 
ргіпї Ф#һ "$1: $1іпе $гапду\п” 
} 
} 


При этом на экран будет выведено что-нибудь вроде следующего: 


1: 0. 124115971686165 0. 20872819474074 

2: 0 156618299751194 0. 678171662366353 
3: 0. 799749050426126 0.300184963960792 
4: 0. 599474551447884 0. 213935286029916 
5: 0.700232143543861 0. 800773751296671 

6: 0.201203608274334 0. 0654303290639575 
7: 0.605381294683365 0. 718162304090487 
8: 0. 452976481105495 0. 574026269121667 
9: 0.736819876983848 0. 391737610662044 
10: 0.518606540417331 0. 381805078272308 


Но это не все! Вывод на экран был произведен благодаря символу «-» в строке +іе 
«ОСАТТЕВ выше. Но в той же строке было выдвинуто требование создать файлы ѓтрі/, 
ітр2 и ітр4, а файл ітрЗ открыть в режиме добавления в конец. (В цикле также 
производился вывод в дескриптор файла *№, но это не произвело никакого инте- 
ресного эффекта, если, конечно, для вас не представляют интереса черные дыры.) 


Неочевидная ловушка при отвязывании 


Когда используется объект, полученный от їіе или і1ей, а класс определяет ме- 
тод-деструктор, возникает неочевидная ловушка, которой вы должны беречься. 
Рассмотрим такой (возможно, натянутый) пример класса, использующего файл 
для регистрации всех значений, присваиваемых скаляру: 


раскаде Вететрег; 


зи6 ТТЕЗСАЁАВ { 
ту $С1а$$ = ЅһЇҒЇ; 
пу $Ғі1епате = ѕһіғт 
ореп(ту фһапаіе, “>” $11епате) 
|| діе “Невозможно открыть $Р1]епате $! \п"; 
ргіпі Фһапд1е “Старт\п” 
р1еѕѕ {ЕН => $һапд1е, МАШЕ => 0}, $с1азз, 


ѕиб РЕТСН { 
пу $561# = 5һ1її; 
гетигп Фѕе1#->{МАЦЈЕ} 


зиб ТОВЕ { 
пу $561? = Зһіғї; 
ту $уа1ие = әһіғі; 
ту Фһапа1е = $ѕе1#-> {ЕН}; 
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ргіпї Фпапд1е “$уа1ие\п” 
$ѕе1#-> {МАШЕ} = $уа1ие; 
} 


ѕию РЕЅТАОҮ { 
пу $561# = Зһі?Т; 
ту $һапа1е = $ѕе1г->{ЕН), 
ргіпі $һапа1е “Конец\п” 
с1оѕе $папа]е; 

} 


1 
А это пример использования класса Вететбег: 


и$е ѕїігісї; 
иѕе Вететбег; 


ту $Ргед; 

$х = @е $Ргед, “Вететььг” "сате1. 109”; 
$Егед = 1; 

$ғгед = 4; 

$ғгеа = 5, 

ипїіе $#гед; 

ѕуѕет “саї сате1. 109”; 


А это вывод примера: 


Старт 
1 
4 
5 
Конец 


Пока все хорошо. Добавим в класс Нететьег еще один метод, разрешающий ком- 
ментарии в файле, например такой: 


50б соттепё { 

пу $зе1Р = ѕһі?ї; 

пу $пеѕѕаде = =1#ї; 

ргіп { $%5е1#-> {ЕН} } $һапс]е $теѕѕаде. 
} 


И вот предыдущий пример с добавлением вызова метода соппепї: 


иѕе этг1ст; 
џѕе Вететбег; 


пу ($Ғгеа, $х); 
$х = Че $Ғгеа, “Вететбег”, "саті . 109"; 


$Ггед = 1, 
$Ргед = 4; 
соттепе $х “спапд1п9...”; 
$Егед = 5; 


ипііе $Ргед, 
зузфет "саї сате1. 109"; 
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Теперь файл окажется пустым, чего вы, вероятно, не желали. И вот почему это 
происходит. Связывание переменной ассоциирует ее с объектом, полученным от 
конструктора. На этот объект обычно имеется только одна ссылка: та, что скры- 
вается за самой связанной переменной. Вызов ипїіе разрывает ассоциацию и лик- 
видирует эту ссылку. Поскольку ссылок на объект больше не осталось, запускает- 
ся метод ОЕЗТВОУ. Однако в примере выше мы имели вторую ссылку на объект, свя- 
занную с $х. Это значит, что после џпїіе по-прежнему сохраняется действующая 
ссылка на объект. ОЕЗТАОУ запущен не будет, запись буфера в файл и закрытие 
файла не произойдет. Вот почему не было вывода: буфер дескриптора файла по- 
прежнему находился в памяти. На диск он не попадет до выхода из программы. 


Чтобы убедиться в этом, можно использовать флаг командной строки -ш или 
включить втекущую лексическую область видимости прагму изе магпіпоѕ "ипііе"“. 
В том и другом случае выявляется обращение к џпїіе на момент существования 
ссылок на связанный объект. В этом случае Регі выводит предупреждение: 


иптіе аттетртед мп.1е 1 1ппег геѓегепсеѕ $1111 ех1ѕї 
[попытка опі1е при существовании 1 внутренней ссылки] 


Чтобы заставить программу работать правильно и подавить вывод предупреж- 
дающих сообщений, ликвидируйте лишние ссылки на связанный объект перед 
вызовом ип1е. Это можно сделать явно: 


ипдег $х; 
ипііе $Егед, 


Однако часто эта проблема решается простым выходом из области видимости пе- 
ременных в нужный момент. 


Модули для связывания в СРАМ 


Прежде чем вы загоритесь написать собственный модуль для связывания, убеди- 
тесь, что никто не сделал этого до вас. В СРАМ имеется масса модулей для связы- 
вания, и число их растет с каждым днем. (Или, во всяком случае, с каждым ме- 
сяцем.) В табл. 14.2 перечислены некоторые из них. 


Таблица 14.2. Модули для связывания в СРАМ 


Описание 

ТО::Игарт1е Оборачивает связанные объекты в интерфейс 10: :Напд1е 

МЕОВМ Прозрачное хранение сложных данных, а не только простых строк, 
в файле ОВМ 

Тле::Саспе::1 ВО Реализует кэш с алгоритмом вытеснения давно неиспользуемых 

Тіе::Сопѕї Предоставляет скаляры-константы и хеши-константы 

Тіе::Соопїег Заколдованные скалярные переменные, увеличивающиеся при каж- 
дом обращении 

Т1е::СРНаѕћ Реализует хеш, не чувствительный к регистру, но сохраняющий его 

Тіе::СусІе Циклический обход значений в списке через скаляр 


Тіе::0ВІ Связывает хеши с реляционными базами данных ОВ 
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Модуль _ 


Тіе: 
Тіе: 
че: 
Те: 


Тіе: 


Тіе: 
Тіе: 
Тіе: 
Тіе: 
Тіе: 
Тіе: 
Тіе: 
Тіе: 
Тіе: 


Тіе: 


Тіе: 


Тіе: 


Тіе: 


Тіе: 
12е: 


Тіе: 


016+ 
:1рісїРі1е 

:0№5 
:Епсгуртеднаѕп 
:ЕіЈеіА0Сасће 


:Ғ1арғҒ1ор 
:Наѕћреғаџ1+ѕ 
:НаѕћНіѕїогу 
пСа1 

:ІхНаѕћ 

АР 
:Регѕіѕїепї 
:Ріск 

АОВМ 

:ЗТрЕЋА 


:15уѕ100 


Техїріг 
Тодд1е 


Т2 
:УесАггау 
Маїсһ 


М1п32::ТіеВедіѕігу 
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Таблица 14.2 (продолжение) 
Описание 


Связывает хеш с сервером ВРС дісі 

Связывает хеш с локальным файлом словаря 
Связывает интерфейс с №еї: :№ 

Хеши (и производные объекты) с шифрованием полей 


Реализует облегченный, базирующийся на файловой системе. посто- 
янный кэш ГКО (с вытеснением давно неиспользуемых) 


Реализует связывание, чередующее два значения 

Позволяет хешу иметь значения по умолчанию 

Отслеживает историю всех изменений в хеше 

Связывает хеши с файлами 1Са1 

Упорядоченные ассоциативные массивы для Рег] 

Реализует интерфейс к базе данных АР 

Предоставляет долгоживущие структуры данных через їіе 
Случайным образом выбирает (и удаляет) элементы множеств 
Связывает хеши с реляционными базами данных 


Направляет вывод дескриптора ЭТОЕВВ в другой процесс, например 
в почтовую программу 


Связывает дескриптор файла для автоматического вывода в систем- 
ный журнал 


Связывает каталог файлов 


Поочередно возвращает истинное и ложное значения. и так до беско- 
нечности 


Связывает $Т7, настройки %ЕМ\ и вызов 25е (3) 
Интерфейс массива для вектора битов 
Устанавливает контрольные точки на переменные Рей 


Предоставляет мощные и простые способы работы с реестром Місго- 
ѕоѓі МіпӢожѕ 


П 


Рей как технология 


Межпроцессные взаимодействия 


У процессов в компьютере почти столько же способов общения друг с другом, 
сколько у людей. Сложность взаимодействий между процессами не следует недо- 
оценивать. Бесполезно искать смысл в словах, если ваш приятель говорит на язы- 
ке жестов. Аналогично, два процесса могут общаться между собой, только догово- 
рившись о средствах связи и основываясь на соглашениях, построенных на этих 
средствах. Как и при любом обмене информацией, соглашения, о которых нужно 
договориться, простираются от лексических до практических: от используемого 
жаргона до очередности вступления в разговор. Эти соглашения необходимы, по- 
тому что очень трудно передавать голую семантику в отсутствие контекста. 


На нашем жаргоне межпроцессные взаимодействия обычно называются ГРС (т- 
фегргосезз Соттипісайоп). Ре реализует различные механизмы ІРС-взаимодей- 
ствия, от самых простых до самых сложных. Выбор механизма зависит от слож- 
ности передаваемой информации. В простейших случаях почти никакая инфор- 
мация не передается: просто поступает уведомление о том, что в некоторый мо- 
мент произошло некоторое событие. В Рей передача информации о простых 
событиях производится с помощью механизма сигналов, сделанного по образцу 
системы сигналов ОМХ. 


Средства поддержки сокетов в Рег! – противоположная крайность. Эти средства 
позволяют обмениваться информацией с любым другим процессом в Интернете 
в соответствии с выбранным протоколом, который реализуют обе стороны. Конеч- 
но, за такую свободу приходится платить: нужно пройти через ряд этапов, чтобы 
установить соединение и обеспечить использование языка, понятного другому 
процессу. Это, в свою очередь, может потребовать соблюдения некоторого количе- 
ства других странных обычаев, зависящих от местных нравов. Для выполнения 
всех требований протокола вас могут даже обязать разговаривать на одном из та- 
ких языков, как ХМІ., Јауа или Рей. Ужас. 


Посередине располагаются средства, предназначенные, в основном, для связи 
с процессами натой же машине. В их число входят старые добрые файлы, конвей- 
еры, очереди ЕІЕО и различные системные вызовы Бузфет У ТРС. Поддержка этих 
механизмов зависит от платформы; современные ОМІХ-системы (в том числе 
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Арре ОЗ Х) должны поддерживать все средства, а большинство средств, зг ис- 
ключением сигналов и 8уѕУ ІРС, поддерживается во всех свежих операционных 
системах М1сгозоЁй, включая каналы, ветвление процессов (ѓогкіпе), блокировку 
файлов и сокеты. 


Дополнительные сведения о переносимости в целом можно найти в стандартном 
наборе документации Рей (в любом формате, поддерживаемом вашей системой), 
в разделе регірогі. Специфическую для Місгоѕоё информацию можно найти ь раз- 
делах регішіп32 и регіјогЕ, которые устанавливаются отнюдь не только на систе- 
мах, созданных Місгозѕоѓё. В качестве учебников предлагаем следующие книги: 


• «Рей СооКЪоок, Ѕесопа Ел оп», Тот Сһгіѕпапѕеп и Ма ап Тогкіпсёоп, О’Ве!- 
1у, главы с 16 по 18. 


• «Адуапсеа Ргогашииия іп ће ОМІХ Епуігоптепі», Бу У. Кісһага Э%еуепз апа 
Ѕеерћһеп А. Кайо, Аайіѕоп-Меѕ1еу (3га Еа! оп, Мау 2013). 


• «ТСР/ІР Шоиѕігатед», У. Вісһага Ѕёеуепѕ, тома 1-1 (Адаіѕоп-Мезѕ1еу, 1992—1996). 


Сигналы 


В Рей применяется простая модель обработки сигналов: хеш %516 содержит ссыл- 
ки (символические или жесткие) на определенные пользователем обработчики 
сигналов. Некоторые события побуждают операционную систему доставлять сиг- 
налы затронутому ими процессу. Обработчик, соответствующий этому событию, 
вызывается с одним аргументом, содержащим название сигнала. Для отправки 
сигнала другому процессу используется функция кі11. Можно считать это переда- 
чей процессу одного бита информации. Если в том процессе для данного сигнала 
установлен обработчик, то при получении сигнала он может выполнить некото- 
рый код. Однако передающий процесс не может получить какой-либо ответ, кро- 
ме известия о том, что сигнал был успептно отправлен. Отправитель не имеет ни- 
какой обратной связи, чтобы узнать, что сделал с сигналом принимающий про- 
цесс и сделал ли вообще. 


Мы классифицировали эту возможность как форму ІРС, но на практике сигналы 
могут поступать из разных источников, не только от других процессов. Сигнал 
может поступить и от вашего собственного процесса или быть сгенерирован в ре- 
зультате того, что пользователь ввел особую клавиатурную последовательность 
(например, Сопго(-С или Сопёго|-2), или исходить от ядра системы вследствие воз- 
никновения особого события, такого, например, как завершение работы порож- 
денного процесса, исчерпание памяти стека вашим процессом, превышение огра- 
ничения размера файла или памяти. Однако вашему собственному процессу не- 
легко различить эти случаи. Сигнал – это как посылка, таинственным образом 
оказавшаяся на вашем пороге и не имеющая обратного адреса. Вскрывать ее сле- 
дует осторожно. 


1 За исключением сокетов АЕ Џ№ІХ. 


2 У. Ричард Стивенс и Стивен Раго «ОМТХ. Профессиональное программирование», 8-е 
издание. — Пер. с англ. — СПб.: Символ-Плюс, 2014. 


На практике это скорее пять или шесть битов, в зависимости от того. сколько сигналов 
определяет операционная система, и от того, использует ли процесс-собеседник факт 
отсутствия дополнительного сигнала. 


Сигналы 501 


Поскольку элементами массива %516 могут быть жесткие ссылки, в качестве обра- 
ботчиков простых сигналов общепринято использовать анонимные функции: 


$те{тмт} ѕир { діе “\пВыметаюсь! \п” }; 
$5ІО{АЕВМ) = ѕир { оіе “Сработал твой будильник” }; 


Можно также создать именованную функцию и присвоить ее имя или ссылку на 
нее соответствующему элементу хеша. Например, чтобы перехватить сигналы 
прерывания и завершения (часто привязываемые к Сопёго[-С и Соп{го|-\ на клавиа- 
туре), установите такой обработчик: 


зи6 саїсћ_ғар { 
пу Фѕідпате = $һЇЁТ; 
оиг феһисКе++; 
91е “Кто-то послал мне $16$$109папте!”; 


} 


фэпискз = 0; 
$ЭТ@{ТМТ} = "сафсН_ гар“; # всегда означает ётаіп: :саїсћ_ғар 
ф9ІС{ІМТ) = \&саїсһ_ғар; # самый лучший вариант 


$516{ОТ} = \ёсаїсћ гар; # перехват еще одного сигнала 


Обратите внимание, что в обрабогчике сигналов мы лишь устанавливаем глобаль- 
ную переменную и инициализируем исключительную ситуацию вызовом біе. Это 
было важно в старых версиях Рег], когда еще не были реализованы безопасные 
сигналы, потому что в большинстве систем библиотека С нереентерабельна, а сиг- 
налы передаются асинхронно. Это могло вызвать ошибку даже в самом надежном 
коде на Рец. С реализацией безопасных сигналов эта проблема исчезла. 


Еще более простой способ перехвата сигналов состоит в использовании прагмы 
ѕібігар для установки простых обработчиков сигналов по умолчанию: 


иѕе ѕідіғар ам(діе ІМТ ЧИТ); 
иѕе ѕідігар дм(91е ипїгарреа погта1 -ъідпа15 
ѕтаск-їгасе апу еггог-ѕідпа15); 


Эта прагма полезна, если вы не хотите утруждаться созданием собственного обра- 
ботчика, но все же хотите перехватывать опасные сигналы и осуществлять кон- 
троль над завершением работы. По умолчанию некоторые из этих сигналов могут 
быть настолько смертельными для процесса, что программа просто замрет на 
месте, получив один из них. К несчастью, это означает, что все функции ЕМ для 
обработки при завершении и методы ОЕЗТВОУ для закрытия объектов не будут вы- 
званы. Зато они вызываются при обычных исключительных ситуациях Рег! (на- 
пример, при вызове 016), поэтому данную прагму можно использовать для безбо- 
лезненного преобразования сигналов в исключительные ситуации. Даже если 
сами вы не будете обрабатывать сигналы, ваша программа поведет себя коррект- 
но. Читайте в описании изе ѕідігар в главе 29 о многих дополнительных возмож- 
ностях этой прагмы. 


Обработчику в %516 можно также присвоить одну из строк, “ТСМОВЕ” или "ОЕҒАЏТ”, 
и тогда Регі попытается отбросить сигнал или разрешить для него действие по 
умолчанию (хотя некоторые сигналы нельзя ни перехватить, ни игнорировать, 
например сигналы КІШ и ТОР; список сигналов, имеющихся в системе, и соответ- 
ствующие сигналам режимы по умолчанию можно найти на странице ѕідпа (3) 
справочного руководства, если оно у вас есть). 
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В операционной системе сигналы представлены как числа, но Рег], как и боль- 
шинство людей, предпочитает символические имена волшебным числам. Чтобы 
узнать имена сигналов, можно вывести ключи хеша %516 или выполнить команду 
ЕІ -1, если она поддерживается системой. Можно также использовать стандарт- 
ный модуль Рег! Соп{19, чтобы определить соответствие между именами и номера: 
ми сигналов в операционной системе. Пример см. в Соп/іє(8). 


Поскольку %5Т6 — это глобальный хеш, изменения в нем влияют на всю програм- 
му. Часто более тактично по отношению к остальной части программы заклю- 
чить свою обработку сигналов в ограниченную область видимости. Сделайте это 
при помощи обработчика сигнала 10са1, который прекратит свое действие после 
выхода из охватывающего блока. (Но помните, что значения 10са] видны в функ- 
циях, вызываемых внутри этого блока.) 


{ 
1оса1 $$16{1№Т} = `ІСМОВЕ `; 
5 # Делайте здесь, что хотите, игнорируя все 5161МТ 
#п(); # 5ІбІМТ игнорируются внутри Рп() тоже! 


# И здесь. 
} # Выход из блока восстанавливает прежнее значение $516{ІМТ}. 
+п(); # 5ІСІМТ не игнорируются внутри Ёп() (предположительно). 


Передача сигналов группе процессов 


Процессы (по крайней мере, в ОМІХ) объединяются в группы, обычно соответст- 
вующие заданию в целом. Например, при запуске одной команды оболочки, со- 
стоящей из последовательности команд-фильтров, передающих данные по кон- 
вейеру одна другой, все эти процессы (и порожденные ими процессы) будут при- 
надлежать одной и той же группе процессов. Этой группе процессов будет назна- 
чен номер, соответствующий номеру процесса лидера группы. Если, посылая 
сигнал, указать положительный номер процесса, сигнал будет отправлен только 
этому процессу, но если указать отрицательный номер, сигнал будет отправлен 
каждому процессу в группе с номером, равным соответствующему положитель- 
ному числу, т. е. номеру процесса лидера группы процессов. (Удобно для лидера 
группы процессов то обстоятельство, что идентификатор группы процессов со- 
храняется в переменной $$.) 


Предположим, что программа хочет послать сигнал отбоя (һапе-ир) всем порож- 
денным процессам, которые она запустила непосредственно, плюс внукам, запу- 
щенным этими порожденными процессами, плюс правнукам, запущенным эти- 
ми внуками, и т. д. Для этого программа сначала должна вызвать $е1рогр(о,0), 
чтобы стать лидером новой группы процессов, и все процессы, которые она соз- 
даст, будут входить в новую группу. Не имеет значения, как эти процессы будут 
запускаться: вручную через ѓогк, автоматически через конвейеризованные ореп 
или как фоновые задания посредством ѕуѕїеп(“сті &). Даже если у тех процессов 
будут собственные потомки, отправка сигнала отбоя всей группе процессов най- 
дет их все (за исключением процессов, которые организовали собственную груп- 
пу или поменяли свой ОТО, чтобы получить «дипломатический иммунитет» от 
ваших сигналов). 


{ 
Іоса1 $5І6{НЏР} = “ТС№ОНЕ"; # исключить себя самого 
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К111(НУР, -$$); # послать сигнал своей собственной группе процессов 
} 


Сигнал с номером 01 также представляет особый интерес. Этот сигнал не оказы- 
вает влияния на целевой процесс, а проверяет, жив ли тот и не поменял ли свой 
ТТР. Таким образом, нулевой сигнал проверяет, возможна ли передача сигнала, 
но фактически не передает его. 


ип1ез$ (кі11 0 => $К19_р19) { 
магп “что-то нехорошее произошло с $кіа _ріа"“; 


} 


Сигнал с номером 0 является единственным сигналом, который работает одина- 
ково в Ре! для операционных систем М1сгозоЁ и ОМІХ. В системах М1сгозо 
функция кі11 фактически не передает сигнал. Вместо этого она заставляет целе- 
вой процесс завершиться со статусом, соответствующим номеру сигнала. Когда- 
нибудь это может быть исправлено. Однако волшебный сигнал 0 работает стан- 
дартным неразрушающим образом. 


Уборка зомби 


По завершении процесса ядро операционной системы посылает его родителю сиг- 
нал СНІ, и завершенный процесс превращается в зомби, пока его родитель не вы- 
зовет иа11 или маіїріа. Если в Ре! запустить другой процесс без помощи Тогк, всю 
заботу об уборке зомбированных потомков Ре!| возьмет на себя, но в случае при- 
мененин голого Гогк предполагается, что вы сами убираете за собой, Во многих, 
но не во всех ядрах простым приемом для автоматической уборки зомби является 
установка $5ТС{СНЬ} в "ТСМОНЕ". Более гибкий (но трудоемкий) подход состоит в са- 
мостоятельной их уборке. В связи с тем что несколько потомков могут умереть, 
прежде чем вы соберетесь заняться ими, необходимо убирать своих зомби в цик- 
ле до тех пор, пока их больше не останется: 


иѕе Р051Х ":5уѕ маії ћ"; 
зир ВЕАРЕЯ { 1 ипїі1 маіїрід(-1, ММОНАМ№) == -1) } 


Чтобы запускать этот код должным образом, можно установить обработчик сиг- 
нала СНР: 


$$16{СНЬО} = \&ВЕАРЕВ: 


или, если код работает в цикле, сделать так, чтобы «уборщик» запускался на оп- 
ределенных итерациях. 


Завершение медленных операций по тайм-ауту 


Обычным применением сигналов является ограничение времени выполнения 
длительных операций. В ОМІХ (или любой другой РОЗХ-совместимой системе, 
поддерживающей сигнал АВМ) можно попросить ядро спустя некоторый проме- 
жуток времени отправить процессу сигнал АВМ: 


Ранее этот сигнал имел символическое имя 51631, но, поскольку его номер однознач- 
но соответствует имени, оно впоследствии перестало поддерживаться, и теперь данный 
сигнал можно использовать только по его номеру. – Прим. перев. 


Это действительно технический термин. 
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у5е Ғспі1 ”:Р1оск” 


е\а1 { 

1оса1 $5І6{АІВМ} = ѕир { діе “перезапуск будильника” }; 

а1агт 10; # подать сигнал через 1% секунд 

е\а1 { 

Ғ1осК(ЕН, 10СК_ЕХ) # монопольная блокировка 
|| діе “невозможно получить блокировку Т1осК: $! “; 

}; 

а1агт 0; # отменить сигнал 
а1агт 0, # защита от ситуации гонки за ресурсами 


91е 11 $0 && $@ !- /перезапуск будильника/; # повторное возбуждение 


Если аварийный сигнал поступит во время ожидания снятия блокировки, и вы 
просто перехватите сигнал и выполните возврат, то попадете обратно в функцию 
Ғ1оск, потому что Ре! автоматически перезапускает системные вызовы, когда это 
возможно. Единственный выход состоит в том, чтобы возбудить исключитель- 
ную ситуацию через 01е, а затем позволить еуг1 перехватить ее. (Это срабатывает, 
поскольку исключительная ситуация приводит к вызову функции [опартр(З) из 
библиотеки С, которая действительно выводит нас из перезапущенного системно- 
го вызова.) 


Вложенная ловушка для исключительной ситуации организована здесь потому, 
что функция Ї1оск возбуждает исключительную ситуацию, если на данной плат- 
форме системный вызов ѓ10ск не реализован, а сбросить аварийный сигнал нуж- 
но в любом случае. Второй а1агт 0 дается на случай, если сигнал придет после 
выполнения ѓ10ск, но до того как будет достигнут первый а1агп 0. Без второго а1агп 
есть небольшая вероятность попасть в ситуацию гонки за ресурсами, однако ве- 
личина вероятности не играет роли: ситуация либо существует, либо нет. Мы 
предпочитаем, чтобы она не существовала. 


Блокировка сигналов 


Иногда желательно отложить прием сигнала на время выполнения критического 
фрагмента кода. Просто проигнорировать сигнал нежелательно, но текущая за- 
дача слишком важна, чтобы ее можно было прервать. В хеше %516 блокировка 
сигналов не реализована, но она осуществляется в модуле РОЗ1Х через интерфейс 
к системному вызову &ргостазЁ(2): 


изе РОЗТХ дм(:$19па1_п); 
$$195еЕ = РОЅІХ: :5195еї->пем; 
фр1оскѕеї = Р051Х: :5195еї->пем(516ІМГ, $16001Т, 5ІССНІЮ); 
ѕіоргостаѕк(510_ВІОСК, $01оскѕеї, $5ідѕеї) 
|| діе “Невозможно заблокировать сигналы ІМТ, СИТТ, СНО. $! \п" 


Пока эти три сигнала заблокированы, можете делать что угодно, не опасаясь, что 
вас потревожат. Завершив критический фрагмент, разблокируйте сигналы, вос- 
становив прежнюю маску сигналов: 


ѕідргостаѕк(516_ЅЕТМАЅК, $5ідѕеї) 
|| діе “Невозможно восстановить сигналы ІМТ, ОИТТ, СНО: $! \п” 


Если за время действия блокировки поступили какие-либо из этих трех сигна- 
лов, они немедленно будут доставлены. Если число необработанных различных 
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сигналов больше одного, они поступят в произвольном порядке. Кроме того, нель- 
зя определить, какой сигнал сколько раз был получен за время блокировки.! На- 
пример, если девяті порожденных процессов завершились, пока вы блокировали 
сигналы СН! 0, ваш обработчик (если он есть) после разблокирования будет вызван 
только один раз. Вот поэтому, удаляя зомби, нужно повторять цикл, пока их со- 
всем не останется. 


Безопасность сигналов 


До версии у5.8 Ре] пытался интерпретировать сигналы как прерывания и обра- 
батывать их незамедлительно, невзирая на состояние интерпретатора. Такой 
подход был изначально ненадежным из-за проблем реентерабельности. Он мог 
приводить к повреждению собственной памяти интерпретатора Рег] и аварийно- 
му завершению процесса - и это еще не самый печальный сценарий. 


В настоящее время, когда процессу передается сигнал, Рег просто помечает его 
как ожидающий обработки. Затем, в более безопасный момент цикла интерпре- 
тации, приступает к обработке всех ожидающих сигналов. Это и безопаснее, 
и аккуратнее, и надежнее, хотя и не всегда своевременно. Некоторые операции, 
выполняемые Реп, такие как сортировка чрезвычайно большого списка, могут 
занимать продолжительное время. 


Чтобы вернуть Регі к прежнему (неправильному и ненадежному) способу обработ- 
ки сигналов, назначьте переменной среды РЕН! _516№АІ5 значение "ипѕаѓе". Но преж- 
де внимательно ознакомьтесь с ризделом «Реѓеггед Эіспаіѕ» (отложенные сигна- 
лы) страницы регИрс справочного руководства. 


Файлы 


Возможно, вы никогда ранее не рассматривали файлы как механизм ІРС, но на 
них приходится львиная доля межпроцессных взаимодействий, т.е. значительно 
большая, чем на все остальные средства, вместе взятые. Когда один процесс поме- 
щает свои драгоценные данные в файл, а другой извлекает эти данные, между 
этими процессами происходит обмен информацией. Среди рассмотренных здесь 
форм ТРС файлы стоят особняком: как свиток папируса, погребенный в пустыне 
и раскопанный через тысячелетия, файл может быть загружен и прочитан чере: 
длительное время после кончины его автора.? Популярность файлов не вызывает 
удивления, если учесть продолжительность хранения и относительную простоту 
применения. 


Использование файлов для передачи информации из далекого прошлого в неиз: 
веданное будущее преподносит мало сюрпризов. Файл записывается на какой-то 
постоянный носитель, например диск, и все. (Если файл содержит НТМЕ, можно 
сообщить веб-серверу, где его искать.) Интересная задача возникает, если все сто- 
роны еще живы и пытаются общаться между собой. В отсутствие некоторого со- 
глашения относительно того, чья очередь сказать свое слово, надежная связь не- 


1 Обычно. Подсчет сигналов может быть реализован в некоторых системах реального 


времени согласно последним спецификациям, но мы таких пока не встречали. 


2 Если предположить, что у процесса может быть кончина. 
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возможна; соглашения можно достичь с помощью блокировки файла, о чем рас- 
сказывается в следующем разделе. А через один раздел мы обсудим особые отно- 
шения, существующие между родительским процессом и его потомками 
и позволяющие связанным родством сторонам обмениваться информацией по- 
средством наследования доступа к одним и тем же файлам. 


Конечно, возможности файлов ограничены, если речь идет о таких вещах, как 
Удаленный доступ, синхронизация, надежность и управление сеансом. В других 
разделах данной главы рассказывается о различных механизмах ГРС, созданных 
для преодоления таких ограничений. 


Блокировка файлов 


В многозадачной среде следует проявлять осторожность, чтобы не вступить в кон- 
фликт с другими процессами, которые пытаются обратиться к используемому ва- 
ми файлу. Если все процессы осуществляют только чтение, проблем не возника- 
ет, но как только хотя бы одному процессу понадобится что-нибудь записать 
в файл, начинается полный хаос, если только какой-нибудь механизм блокиров- 
ки не выступает в качестве регулировщика движения. 


Никогда не используйте существование файла (т. е. проверку -е $1116) в качестве 
индикатора блокировки, потому что условие гонки может возникнуть между про- 
веркой существования файла с данным именем и операцией, которую вы собирае- 
тесь с ним совершить (например, создать его, открыть или уничтожить). Допол- 
нительно об этом читайте в разделе главы 20 «Разрешение ситуации гонок». 


Переносимым интерфейсом Ре! для блокировки является функция Е ]0ск(НАМОГЕ, 
РІА65), описываемая в главе 27. Рег! добивается максимальной переносимости пу- 
тем использования самых простых и наиболее распространенных возможностей 
блокировки, имеющихся на возможно большем числе платформ. Эта семантика 
достаточно проста для эмуляции в большинстве систем, в том числе таких, кото- 
рые не поддерживают обычный системный вызов !1]оск, например Буфет У или 
Уіпаоуѕ МТ. (Если у вас система М1сгозой более ранняя, чем МТ, то вам, вероят- 
но, не повезло, как и в случае, если у вас система Арре более ранняя, чем ОЗ Х.) 


Есть две разновидности блокировок: блокировки с совместным (ѕћһагед) доступом 
(флаг 1ОСК_ЗН) и блокировки с монопольным, или взаимоисключающим (ехсјиѕіуе), 
доступом (флаг 0СК_ЕХ). Несмотря на коннотации слова «монопольный», процессы 
не обязаны подчиняться блокировкам файлов. Смысл в том, что ѓ10ск реализует 
только рекомендательную блокировку, которая не мешает другим процессам чи- 
тать из файла или писать в него. Запрос монопольной блокировки — это способ, ко- 
торым процесс позволяет операционной системе приостановить его выполнение, 
пока все текущие блокировки, будь они с совместным доступом или монопольные, 
не будут сняты. Аналогично, когда процесс запрашивает блокировку с совмест- 
ным доступом, он просто приостанавливает свое выполнение, пока не будут сняты 
все монопольные блокировки. Безопасный совместный доступ к файлу возможен 
только в случае применения механизма блокировки файлов всеми сторонами. 


Поэтому вызов ѓ1оск по умолчанию является блокирующей операцией. Это означа- 
ет, что, если требуемую блокировку нельзя получить немедленно, операционная 
система приостановит процесс до тех пор, пока блокировка не станет возможной. 
Вот как получить блокировку с совместным доступом, применяемую обычно для 
чтения файла: 
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изе Еспі1 ом(:БЕРАЦЕТ :Е1оск); 

ореп(ЕН, “< Ғі1епате”) || діе “невозможно открыть файл с именем: $! “; 
Ғ1оск(ЕН, 10СК_5Н) || діе "невозможно блокировать файл с именем: $!” 
# теперь выполнить чтение из ЕН 


Можно попытаться получить блокировку в неблокирующем режиме, включив 
флаг 10СК_ А в запрос 1оск. Если получить блокировку немедленно не удается. 
вызов функции тут же завершается неудачей, и она возвращает ложное значение. 
Например: 


Ғ1оск(ЕН, ОСК 5Н | 10СК МВ) 
|| діе “невозможно блокировать файл: $! "; 


Можно попытаться сделать что-то другое, не возбуждая исключительную ситуа- 
цию, как в этом примере, но не вздумайте после неудачного завершения ѓ10ск про- 
изводить с файлом операции ввода/вывода. Если в блокировке отказано, то, не 
получив ее, не следует обращаться к файлу. Неизвестно, в каком искаженном со- 
стоянии вы получите файл. Основная цель неблокирующего режима в том, чтобы 
дать возможность «отойти в сторону» и заняться другими делами в период ожида- 
ния. Но он также позволяет организовать более дружественное взаимодействие 
с пользователями, предупреждая их, что для получения блокировки может пона- 
добиться время, чтобы они не чувствовали себя брошенными на произвол судьбы: 


иѕе Еспї1 ом( : ПЕҒАИ.Т : Ғ1осК); 
ореп(ЕН, "< ҒіЛепате”) || діе " невозможно открыть файл с именем $! "; 
ип1еѕѕ (Ғ1оскК(ЕН, ОСК Н | ОСК №8)) { 
1оса1 $] = 1; 
ргіпі "Ждем блокировки файла.. `, 
Ғ1осК(ЕН, 10СК_5Н) || діе " невозможно заблокировать файл с именем: $! 
ргіпі “блокировка получена. \п” 
} 


# теперь можно читать из ЕН 


Некоторые разработчики испытают соблазн поместить такую неблокирующую 
блокировку в цикл. Основная проблема с неблокирующим режимом в том, что 
к моменту, когда вы снова выполните проверку, может оказаться, что кто-то дру- 
гой уже заблокировал файл, потому что вы отошли от своего места в очереди. 
Иногда приходится просто стоять и ждать. Если повезет, под рукой окажутся 
журналы, которые можно почитать. 


Блокируются дескрипторы файлов, а не их имена.!' При закрытии файла блоки- 
ровка автоматически снимается, будь оно произведено явно, вызовом с105е, или 
косвенно, путем повторного открытия указателя или завершения процесса. 


1 Фактически блокируются не дескрипторы файлов (#1еһапа]еѕ), а указатели файлов 
уровня операционной системы, связанные с дескрипторами, поскольку операционная 
система ничего не знает о дескрипторах файлов Рег]. Это означает, что все сообщения 
01е о невозможности получить блокировку по имени файла технически являются не- 
точными. Но сообщения об ошибках вида «Не могу получить блокировку файла, пред- 
ставленного указателем файла, связанным с дескриптором файла, первоначально от- 
крытым для файла с именем {{епате, хотя в данный момент имя {епате может пред- 
ставлять совершенно другой файл, нежели наш дескриптор» просто собьют с толку 
пользователя (не говоря уже о читателе). 
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При получении монопольной блокировки, обычно для записи, нужно проявлять 
еще бблыпую осторожность. Для этого не годится обычная функция ореп; в слу- 
чае применения режима открытия < возникает ошибка, если файл еще не сущест- 
вует, а установив режим >, можно разрушить существующий файл. Чтобы забло- 
кировать файл перед записью в него, используйте зузореп. Успешно открыв файл 
для записи и еще нетронув его, нужно получить монопольную блокировку и толь- 
ко тогда усекать файл. После этого можно записать в него новые данные. 


иѕе Еспт1 ам(:ОЕРАЦЕТ :1оск); 
ѕуѕореп( ЕН, "#і1епате”, 0 МВОМІҮ | 0_СНЕАТ) 

|| 91е “невозможно открыть файл с именем: $! "; 
Ғ1оск(ЕН, +0СК ЕХ) 

|| діе “невозможно заблокировать файл с именем: $!“ 
їігипсате( ЕН, 0) 

|| діе "невозможно сделать усечение файла с именем: $!" 
# теперь можно писать в ЕН 


Если потребуется изменить некоторую часть файла, опять-таки используйте 
ѕуѕореп. На этот раз следует запросить доступ для чтения и записи одновременно, 
при необходимости создав файл. Когда файл открыт, прежде чем выполнять чте- 
ние или запись, нужно получить монопольную блокировку и сохранять ее на все 
время операции. Снять блокировку лучше всего путем закрытия файла, так как 
это гарантирует запись всех буферов на диск перед снятием блокировки. 


При обновлении производится чтение старых значений и запись новых. Обе опе- 
рации нужно выполнять во времн действия одной монопольной блокировки, что- 
бы другой процесс не прочел (неизбежно неверные) данные после (или даже преж- 
де) того, как это сделаете вы, но перед тем как вы закончите запись. (Мы вернем- 
ся к этой ситуации при рассказе о совместно используемой памяти далее в этой 
главе.) 


изе Ғспі1 ом( : ПЕҒАШТ : ?1осК); 


ѕуѕореп(ЕН, “соиптегР11е“, 0_АОМА | О СВЕАТ) 

|| діе “невозможно открыть соџпїег?і1е: $!” 
Ғ1оск(ЕН, ОСК ЕХ) 

|| діе "невозможно заблокировать соџпїег#і1е для записи $ 
$соипїег = <ЕН> || 0; # в первый раз буде” ипде* 
зеек(Ен, 0, 0) 

|| 91е "невозможно вернуться в начало соогїег+і1е : $! 
ргіпі ЕН $соипег+1, “\п” 

|| діе “невозможно выполнить запись в соџпїег?і1е: $! 


# следующая строка в этой программе технически избыточна, но 
# в общем случае мысль правильная 
їгипсате(ЕН, +е11(ЕН)) 

|| діе “ невозможно выполнить усечение соџпїег?і1е: $!"; 
с1оѕе(ЕнН) 

|| 91е “ невозможно закрыть соџпїег?іїе $!”; 


Нельзя заблокировать неоткрытый файл и нельзя применить одну блокировку 
к нескольким файлам. Однако можно использовать отдельный файл в качестве 
«семафора», чтобы обеспечить управление доступом к чему-то еще посредством 
обычных блокировок этого файла-«семафора» в режиме совместного или моно- 
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польного доступа. У такого подхода есть несколько преимуществ. Можно иметь 
один файл блокировки, управляющий доступом к нескольким файлам, избегая 
при этом такого взаимного блокирования (деад1осК), которое происходит, когда 
один процесс пытается заблокировать файлы в одном порядке, а другой — те же 
файлы в другом порядке. Файл-«семафор» можно использовать для блокировки 
целого каталога с файлами. Можно даже управлять доступом к тому, что не нахо- 
дится в файловой системе, например к объекту совместного доступа в памяти или 
сокету, к которому несколько серверов, полученных путем ГогК-ветвления, наме- 
рены применить вызов ассерї. 


Если у вас есть файл ОВМ, не предоставляющий собственного механизма блоки- 
ровки, одновременным доступом к нему нескольких агентов лучше всего управ- 
лять с использованием вспомогательного файла блокировки. В противном случае 
внутренний кэш библиотеки ОВМ может рассинхронизироваться с дисковым 
файлом. Прежде чем вызывать Обтореп или {1е, откройте и заблокируйте файл-чсе- 
мафор». Если вы открываете базу данных с флагом 0 АЮОМҮ, для блокировки по- 
требуется установить флаг [0СК_5Н. В противном случае используйте 10СК_ЕХ для 
монопольного доступа с целью обновления базы данных. (Это действенно, только 
если все участники согласны обращать внимание на «семафор».) 


изе Еспі1 9м(.ОЕРАЦЕТ :110сК), 
изе 08 Рі1е; # только в целях демонстрации; годится любая БД 


ФОВМАМЕ = “/ратп/фо/датаразе”; 
$1СК = $ОВМАМЕ . ” 10сКғі1е“; 


# используйте 0_ВОМВ, если собираетесь что-то поместить в файл блокировки 
зузореп( ОВЕОСк, $ЕСК, 0_АВОМЕУ ! 0 СВЕАТ) 
|| 91е “невозможно открыть $ЕСК: $! "; 


# нужно получить блокировку перед открытием базы данных 
Ғ1оск(ОВіоск, 0СК 5н) 
|| 91е “невозможно 1ОСК_$Н $1СК: $! ": 


+ле(%һаѕһ, "ОВ Еі1е", $ОВМАМЕ, 0_ВОМВ | 0_СВЕАТ) 
|| 91е “невозможно іе $0ВМ№АМЕ: $!”; 


Теперь можно без опаски совершать любые действия с хешем %һаѕћ, связанным 
с базой данных. Закончив работу с базой данных, обеспечьте явное закрытие 
этих ресурсов, причем в порядке, обратном порядку их получения: 


оипііе Жһаѕћ; # закрыть базу данных прежде файла блокировки 
с1оѕе ОВІОСК; # теперь безопасно снять блокировку 


Если у вас установлена библиотека СМО ОВМ, можно использовать неявную бло- 
кировку из стандартного модуля СОВМ_Ее. Если только начальный вызов {1е не 
содержит флага СОВМ_№010СК, библиотека разрешает одновременно открывать файл 
СОВМ для записи только одному процессу и запрещает одновременно открывать 
базу данных записывающим и читающим процессам. 


Передача дескрипторов файлов 


При создании порожденного процесса с помощью ѓогк новый процесс наследует все 
открытые дескрипторы файлов родителя. Использование дескрипторов файлов 
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для взаимодействия между процессами легче всего показать на обычных файлах. 
Важно понять, как это работает, чтобы овладеть более сложными механизмами 
на основе конвейеров и сокетов, описываемыми далее в этой главе. 


Следующий простой пример открывает файл и запускает порожденный процесс. 
Затем порожденный процесс использует дескриптор файла, уже открытый для 
него: 


ореп(ТМРИТ, "< /еїс/тоёӣ”) || 91е "/еїс/тоїа: $! 
1# ($р19 = Ғогк) { ма1{р19($р19,0) } 
е1ѕе { 
деҒіпей($ріа) {1 бе "Ғогк: $! 
мһіле (<ТМРИТ>) { ргіпі "$ $" } 
ехії; # не дать порожденному процессу вернуться в основной код 


} 
# Теперь указатель ТМРИТ в родителе находится в ЕОЕ 


Доступ к файлу, открытому вызовом ореп, сохраняется до закрытия дескриптора 
файла; изменение прав доступа к файлу или привилегий владельца файла не ока- 
зывает влияния на доступ. Даже если процесс позже изменит своего владельца 
(пользователя или группу) либо изменится принадлежность файла, это не окажет 
влияния на уже открытые дескрипторы файлов. Программы, выполняющиеся 
с повышенными привилегиями (такие, как системные демоны или программы, 
запускаемые от имени привилегированного пользователя), часто открывают файл, 
а затем передают указатель порожденному процессу, который не смог бы открыть 
его самостоятельно. 


Хотя эта возможность очень удобна в случае ее целевого применения, она может 
также создавать проблемы с защитой данных при непреднамеренной утечке де- 
скрипторов файлов из одной программы в другую. Чтобы избежать неявной пере- 
дачи доступа к любым указателям файлов, Рег! автоматически закрывает любые 
открытые им дескрипторы файлов (в том числе конвейеры и сокеты) при явном 
запуске новой программы через ехес или неявном выполнении ее через вызов кон- 
вейеризованного ореп, ѕуѕїет или дх// (обратные апострофы). Системные дескрип- 
торы файлов 5ТОТК, $10001 и ЭТОЕВВ являются исключением, поскольку их основ- 
ное назначение — обеспечить связь между программами. Поэтому одним из спосо- 
бов передачи дескриптора файла новой программе является его копирование 
в один из стандартных дескрипторов: 


ореп(ТМРИТ, “< /еїс/тоїд”) || сле "/еїс/тоїа: $!” 
11 ($рій = Ғогк) { мам } 


е15е { 
деғіпед(%ріа) || іе "ѓогк: $! "; 
ореп(5Т0ІМ, "<&ІМРИТ") || 91е “аир: $1”, 
ехес(“сат”, “-п“) || 91е “ехес саї: $! 


} 


Если и впрямь требуется, чтобы новая программа получила доступ к указателю 
файла, отличному от этих трех, это возможно, но вам придется проделать одно из 
двух. Когда Ре! открывает новый файл (конвейер или сокет), он проверяет теку- 
щее значение переменной $Е ($5ҮЅТЕМ ЕО МАХ). Если числовой указатель файла, 
используемый новым дескриптором файла, больше $, указатель помечается как 
подлежащий закрытию. В противном случае Рег! оставит его в покое, и новые 
программы, которые вы запустите, унаследуют доступ. 


Файлы м 


Не всегда легко предсказать, какой числовой идентификатор будет иметь вновь 
открываемый дескриптор файла, но можно временно установить максимальный 
указатель файла в системе равным какому-нибудь очень большому числу: 


# открыть файл и пометить ТМРУТ как открытый на время выполнения ехес 
{ 
1оса1 $Е = 10_000, 
ореп(ТМРИТ, "< /еїс/тоїа") || діе "/еіс/тоїа: $'", 
} # прежнее значение $^Е восстанавливается при выходе из области видимости 


Теперь необходимо заставить новую программу обратить внимание на номер ука- 
зателя только что открытого дескриптора файла. Самое правильное (для систем, 
которые это поддерживают) – передать специальное имя файла, соответствующее 
указателю файла. Если в системе есть каталог с именем /4ео//А или /ргос/$$/1а, 
содержащий файлы с номерами от 0 до максимального числа поддерживаемых 
указателей, вам, возможно, удастся воспользоваться такой стратегией. (Во мно- 
гих системах Глпих есть оба каталога, но только /ргос содержит то, что нужно. 
В ВЅр и Ѕојагіѕ это каталог /4ео//А. Вам придется выяснить, какой из каталогов 
вашей операционной системы лучше подходит для ваших нужд.) Сначала от- 
кройте и пометьте дескриптор файла как открытый для ехес, как показано в при- 
веденном выше фрагменте кода, затем выполните ветвление, как показано ниже: 


іЁ ($р19 = Ғогк) { маії } 


е15е { 
деғіпеа($ріа) || 91е "тогк $!”; 
фғағі1е = “/дем/та/” . Рі1епо(ІМРОТ), 
ехес("саї", “-п“, $?ағі1е) || 01е “ехес сат: $! ; 


} 


Если в системе поддерживается системный вызов Гсп{1, можно вручную изме- 
нить флаг закрытия дескриптора файла при выполнении ехес. Это удобно, когда 
при создании дескриптора файла не было известно. что его потребуется использо- 
вать совместно с порожденными процессами. 


изе Еспі1 дм/Е_ЗЕТЕОИ; 
спе] (ТМРИТ, Е ЅЕТЕЮ, 0) 
|| 91е "Не могу сбросить флаг закрытия при ехес для ТМРОТ $!\п” 
Можно также принудительно закрыть дескриптор файла: 


ҒспЕІ (ІМРОТ, ЕР $ЕТЕО, 1) 
|| 91е ” Не могу установить флаг закрытия при ехес для ТМРУТ: $!\п”; 


А можно запросить текущее состояние: 
изе Еспі1 ом/Е_ЗЕТЕО Е СЕТЕО/; 


ргтпЕЕ(”ТМРИТ будет %5 для ехес\п” 
РспЕ1(ТМРУТ, Е СЕТЕО, 1) ? “закрыт” "оставлен открытым"); 


Если система не поддерживает хранение числовых указателей файлов в файло- 
вой системе, и нужно передать дескриптор файла, отличный от 5Т01№, $57007 или 
ЅТРЕАВ, эту проблему можно решить, но придется выполнить дополнительные те- 
лодвижения. Обычно данная задача решается передачей номера числового указа- 
теля через переменную среды или параметр командной строки. 
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Если выполняемая программа написана на Ре!|, преобразовать числовой указа- 
тель файла в дескриптор можно посредством ореп. Вместо имени файла исполь- 
зуйте номер указателя с приставкой &=. 


ІЁ ((ФЕМ№{іприї_ #апо} // "") =- /^\а$/) { 
ореп(ТМРИТ, “"<&=$ЕМ№М{ іприї _#?дпо}") 
|| діе “невозможно Рдореп $ЕМУ{іприї Ғдпо} для ввода: $! “, 
} 


Все становится проще, если нужно запустить подпрограмму Рей или программу, 
ожидающую получить имя файла в качестве аргумента. Автоматически открыть 
файл по системному указателю можно посредством обычной функции ореп (но не 
зузореп или ореп с тремя аргументами). Представьте, что имеется такая неслож- 
ная программа на Рег]: 


#1 /иѕг/біп/рег1 -р 
# п] - число строк ввода 
ргіпі? “%69 “, $.; 


Если предположить, что указатель ТМРИТ настроен так, чтобы он оставался откры- 
тым при выполнении ехес, эту программу можно вызывать следующим образом: 


фғаѕрес = "<&=” Рі1епо(ІМРІТ); 
ѕуѕіет( "п1". $Ғаѕрес); 


или перехватить вывод: 
@11пе$ = `п1 `$#0ѕрес’ , # одинарные кавычки защищают ѕрес от оболочки 


Запускаете вы другую программу или нет, при использовании числовых указате- 
лей файлов, наследуемых через Гогк, существует одна маленькая ловушка. В отли- 
чие от переменных, которые копируются вызовом #огк и становятся идентичны- 
ми, но независимыми копиями, дескрипторы файлов в обоих процессах действи- 
тельно будут одни и те же. Если какой-то процесс читает данные из дескриптора, 
позиция в файле в другом процессе также увеличивается, и эти данные становят- 
ся недоступными в обоих процессах. Если процессы выполняют чтение поочеред- 
но, возникает своеобразная чехарда. Это очевидно в случае дескрипторов, рабо- 
тающих с устройствами последовательного доступа, конвейерами и сокетами, по- 
скольку такие устройства обычно доступны только для чтения, и данные в них 
хранятся лишь до первой операции чтения, а вот подобное поведение дисковых 
файлов может оказаться неожиданным. Если в результате возникают проблемы, 
после вызова Гогк откройте заново файлы, требующие раздельного просмотра. 


Оператор ГогК является наследием ОМХ, и это значит, что он может быть некор- 
ректно реализован на платформах, отличных от ОМІХ/РОЅІХ. Примечательно, 
что Гогк работает в системах М1сгозой только для Ре! 5.6 (или выше) в Үіпдомє 98 
(или выше). В этих системах Гогк реализуется посредством запуска нескольких 
потоков выполнения внутри одной программы, но это не те потоки, которые по 
умолчанию совместно используют все данные; в данном случае речь только о де- 
скрипторах файлов. 


Каналы 


Канал (ріре) – это однонаправленный вектор ввода/вывода, способный переда- 
вать поток байтов от одного процесса к другому. Каналы могут быть как имено- 
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ванными, таки безымянными. Вам, вероятно, лучше знакомы безымянные ка- 
налы, поэтому с них и начнем. 


Анонимные каналы 


Функция ореп откроет канал, а не файл, если перед вторым аргументом или после 
него поставить символ конвейера. В результате оставшиеся аргументы превра- 
щаются в команду, которая будет интерпретирована как процесе (или группа 
процессов), принимающий или передающий поток данных. Ниже приведен спо- 
соб запуска порожденного процесса, в который осуществляется запись: 


ореп ЗРООГЕН, "| саї -у | 1рг -һ 2>/аеу/пи11" 
|| діе “сап'ї Рогк: $! “; 
1оса1 $510{РІРЕ} = ѕи0 { 91е ѕроо1ег разре бгоке" }; 
ргіпі ЅРООГЕВ "$ФиР\п”; 
с1оѕе ЅРООІЕВ ог а1е "Бад 5роо1: $! $?”; 


Фактически мы запускаем здесь два процесса. Вывод в первый процесс (сай осу- 
ществляется напрямую. Второй процесс (рг) получает выходной поток первого 
процесса. В разработке сценариев для интерпретатора команд это часто называет- 
ся конвейером (ррейпе). Конвейер может объединять в цепочку любое количество 
процессов, при условии, что все промежуточные процессы умеют работать в режи- 
ме фильтра, т.е. читать из стандартного ввода и писать в стандартный вывод. 


Рей использует системный интерпретатор команд поумолчанию (/біп/•ћ в МХ), 
если команда конвейера содержит специальные символы интерпретатора ко- 
манд. Если же запускается только одна команда, и нет необходимости обращать- 
ся к интерпретатору команд, можно использовать формат канала с несколькими 
аргументами: 


ореп ЗРООГЕВ, “|-“, “1рг", “-В” # требует 5.6.1 
|| 91е "сап'ї гип 1рг: $17; 


Если повторно открыть стандартный поток вывода программы как канал в дру- 
гую программу, то с этого момента весь вывод в 5ТОО\Т будет поступать на стан- 
дартный ввод новой программы. Поэтому для организации постраничного выво- 
да! следует использовать: 


Зе (-Ұ 5Т000Т) { # только если $00 является терминалом 
ту Фрадег = ФЕМУ{РАСЕВ} “тоге”: 
ореп(5ТООИТ, “| $радег”) | 91е “невозможно запустить пейджер: $!° 
} 
ЕМ { 
с1оѕе(5Т000Т) || діе “невозможно закрыть ЭТООУТ: $!” 


} 


После записи в дескриптор файла, ассоциированный с каналом, и окончания ра- 
боты с этим дескриптором всегда явно закрывайте его функцией с1оѕе. Благодаря 
этому основная программа не завершит работу раньше своих потомков. 


Вот как запустить порожденный процесс, из которого предполагается осуществ- 
лять чтение: 


1 То есть чтобы просматривать по одному экрану за раз. 
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ореп ЗТАТИ$, ‘петзфат -ап 2>/деу/пи11 |” 
|| 91е "сап'`ї Рогк: $17; 

мһіЛе (<5ТАТЏЅ>) { 
пех і? /^(+ср|оар)/; 
ргіт; 

} 

с1оѕе ЅТАТИЅ || діе “Бад пеіѕёас $! $2”, 


Открыть многоступенчатый канал для ввода можно так же, как для вывода. 
И, как и раньше, можно обойти интерпретатор команд, используя альтернатив- 
ную форму ореп: 


ореп ЅТАТЏЅ, “-|”, "пеёѕтаї", ‘-ап” # требует 5.6.1 
Н діе "сап'ї гип пефзфат: $1”; 


Но при этом вы не получите переадресации ввода/вывода, раскрытия по маске 
и многоступенчатых конвейеров, поскольку Рей полагается в этом на интерире- 
татор команд. 


Возможно, вы заметили, что обратные апострофы дают тот же эффект, что от- 
крытие канала для чтения: 


ргіпі дгер { ! /7(+ср|џиар)/ } `петзфат -ап 2>&1` 
іе "рад песѕїтаї” і? $7; 


Обратные апострофы чрезвычайно удобны. но данная операция загружает в па- 
мять сразу весь объем данных, поэтому часто оказывается более эффективно от- 
крыть дескриптор файла для канала и обрабатывать данные построчно. Так мы 
получаем более тонкий контроль над всей операцией, имея возможность досроч- 
но остановить порожденный процесс, если это потребуется. Большей эффектив- 
ности можно также добиться, обрабатывая входные данные по мере поступления, 
поскольку компьютеры способны чередовать разные операции при одновремен- 
ном выполнении двух или более процессов. (Даже на машине с одним централь- 
ным процессором операции ввода и вывода могут происходить, когла процессор 
занят чем-то другим.) 


Из-за одновременного выполнения двух или более процессов катастрофа может 
постичь порожденный процесс в любой момент между вызовами ореп и с1оѕе. Это 
означает, что родитель должен проверять значения, возвращаемые функциями 
ореп и с10ѕе. Проверки значения одной только оре" недостаточно, поскольку она 
может сообщить лишь об успехе ѓогк и, возможно, о том, что следующая команда 
была успешно запущена. (Да и такую информацию можнс получить только в но- 
вых версиях Регі и только если команда выполнена непосредственно ответвив- 
шимся потомком, а не через интерпретатор команд.) Обо всех катастрофах, про- 
исходящих после этого, потомок сообщает родителю ненулевыми кодами завер- 
шения. Когда функция с10ѕе получает такой код, она возвращает ложное значе- 
ние, указывая, что фактическое значение состояния хранится в переменной $7 
(ФСНТЕО_ЕАНОВ). Поэтому проверка значения, возвращаемого с105е, столь же важна, 
как проверка ореп. Осуществляя запись в канал, следует приготовиться к обра- 
ботке сигнала РІРЕ, который посылается, если процесс на другом конпе завер- 
шился раныше, чем передача ему данных. 
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Разговор с самим собой 


Другой подход к ІРС состоит в том, чтобы заставить программу, так сказать, разго- 
варивать с самой собой. В действительности процесс общается через каналы с соб- 
ственной копией. Этот механизм действует во многом как открытие канала, о кото- 
ром мы говорили в предыдущем разделе, за исключением того, что порожденный 
процесс продолжает выполнять тот же сценарий, а не какую-либо другую команду. 


Чтобы реализовать это с помощью функции ореп, используется псевдокоманда, 
состоящая из знака «минус». Поэтому второй аргумент ореп выглядит как ”-|" 
или "|-" в зависимости от того, хотите вы развернуть конвейер от себя или к себе. 
Как и обычная команда Тогк, функция ореп возвращает идентификатор порож- 
денного процесса в родительский процесс и 0 – в порожденный процесс. Другое 
отличие состоит в том, что дескриптор файла, объявленный в ореп, используется 
только в родительском процессе. В порожденном процессе конец канала прикре- 
пляется к ЭТОМ или 5700107. То есть, если канал открывается к минусу ("|-"), в него 
можно вывести данные, которые потомок найдет в 5ТЬТ№: 


ТЕ (ореп(То, “|-”)) { 
рг1п ТО $Рготрагепт, 

} 

е1е { 
фгосһі1а = <5ТрІМ; 
ехії; 


} 


Если канал открывается от минуса ("-|"), из него можно читать данные. которые 
потомок запишет в 510001: 


1Ғ (ореп(ЕВОМ, “-|”)) { 
фторагепї = <ЕВОМ>; 

} 

е1зе { 
рг1пт УТООУТ $Ёготсп119; 
ехії; 


} 


Обычно эта конструкция используется для обхода интерпретатора команд, когда 
необходимо открыть канал внутри команды. Это может потребоваться, напри- 
мер, чтобы избежать интерпретации содержащихся в команде файловых масок. 
Версия Ре 5.6.1 (или более поздняя) позволяет получить тот же результат, ис- 
пользуя формат ореп с несколькими аргументами. 


Версию ореп, выполняющую ветвление, можно также использовать, чтобы без- 
опасно открыть файл или команду, даже если вы работаете под необходимым 01р 
или СН. Создаваемый функцией ѓогк потомок отбрасывает любые дополнитель- 
ные права доступа, затем безопасно открывает файл или команду и действует как 
посредник, передавая данные между своим более мощным родителем и откры- 
тым файлом или командой. Примеры можно найти в разделе «Доступ к коман- 
дам и файлам при наличии ограниченных прав» главы 20. 


Версию ореп, выполняющую ѓогк-ветвление процессов, можно творчески приме- 
нять для фильтрации собственного вывода программы. Некоторые алгоритмы 
значительно проще реализовать в два отдельных прохода, чем за один. Вот про- 
стой пример, эмулирующий программу ОМХ ѓее(1) путем перенаправления обыч- 
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ного вывода в конвейер. Агент на другом конце конвейера (одна из наших собст- 
венных подпрограмм) распределяет вывод во все указанные файлы: 


Тее( /ттр/Роо”, “/фтр/баг”, “/ттр/д1агсй”) 


мне (<>) { 
ргіпЕ "ФАВСУ аё Ііпе $. => $" 

} 

с10ѕе(5Т000Т) || діе "невозможно закрыть ЗТООбИТ $! “; 


ѕир тее { 
му @оџїриї = ё, 
му ©һапа1еѕ = (); 
Тог ту Фраїћ (@оџиїри+) { 
пу $#һ; # будет инициализирована вызовом ореп ниже 
ип1еѕѕ (ореп ($78, ">", $раїһћ)) { 
магп “невозможно записать в $раїћ: $!” 
пехї; 
} 
риѕћ @һапа1еѕ, $Ёһ; 
} 


# повторно открыть УТОСУТ в родителе и вернуться 
геїигп 1 ту $ріа = ореп($Т000Т. “|-”); 
іе “невозможно выполнить ветвление: $!” ип1езз деғіпед $рід, 


# обработать ЗТОТМ в порожденном процессе 
ме (<5Т0ІМ) { 
Ғог ту $#һ (@һапд1еѕ) { 
ргіпі $#һ $_ || 91е "отказ при выводе из тее’ $! `; 
} 
} 
Рог ту $1 (@папд1еѕ) { 
с10зе($РВ) || діе "отказ при закрытии їее $!”; 


} 


ех1т; # не позволяйте потомку возвращаться в основную программу! 
} 


Этот прием можно применять многократно, чтобы поместить в поток вывода не- 
обходимое количество фильтров. Просто продолжайте вызывать функции, от- 
крывающие 5ТООЦТ с ветвлением процессов, и пусть порожденный процесс читает 
из родительского (который он видит как 5ТОТ\) и передает обработанный вывод 
далее, следующей функции в потоке. 


Другим интересным применением «разговора с самим собой» является перехват 
вывода «плохо воспитанной» функции, которая постоянно выводит свои резуль- 
таты в 570007. Представьте, что в Рей есть только функция ргіпії, а зргіпіѓ нет. 
Тогда потребуется что-то, работающее как обратные апострофы, но с функциями 
Рен, а не с внешними командами: 


Бадғипс( "агд"); # черт, убежала! 
фїгіпо = Ғогкѕир(\ёрайғипс, "аго `); # перехватить как строку 
©іпеѕ = Ғогкѕир(\&радғипс. ”агд”); # как отдельные строки 
зир Тогкѕир { 

ту $К1@р1а = ореп ту $ѕе1?, ”-|”; 
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деғіпеа Фкіаріа || діе “невозможно ветвление: $! `, 
ЭН1Е->(@_), ехії ип1ез$ $К19р19; 

Іоса1 $/ ип1е$$ мапїаггау; 

гефигп <$5е11>; # закрывается при выходе из области видимости 


} 


Мы не утверждаем, что этот код эффективен; связанный дескриптор файла рабо- 
тал бы, вероятно, значительно быстрее. Но написать такой код намного проще, 
когда вы торопитесі сильнее, чем ваш компьютер. 


Двунаправленная СВЯЗЬ 


Использование функции ореп для объединения с другой командой через канал 
достаточно хорошо работает при однонаправленной связи, но как организовать 
двунаправленный обмен? Подход, который кажется очевидным, на самом деле не 
работает: 


ореп(РВОС_ТО_ВЕАР АМО МАІТЕ, “| некоторая программа |") # НЕВЕРНО! 


а если вы забыли включить вывод предупреждений, 10 полностью пропустите 
следующее диагностическое сообщение: 


Сап' до біаігестіопа1 ріре ат тургод 1іпе 3. 
[Невозможно создать двунаправленный канал в тургод строка 3] 


Функция ореп не позволяет сделать это, потому что подвержена взаимоблокиров- 
кам, если не проявлять большую осторожность. Но если очень хочется, го можно 
использовать стандартный библиотечный модуль ІРС::0реп2, чтобы подключить 
два канала к ЭТОМ и 5$Т000Т подпроцесса. Имеется также модуль ІРС::0репЗ для 
тринаправленного ввода/вывода (позволяющий перехватывать и ЭТОЕВВ порож- 
денного процесса), но для него требуется либо «неуклюжий» цикл 5е1есї, либо бо- 
лее удобный модуль 10::5е1есі. Но тогда придется отказаться от буферизованных 
операций ввода Регі, таких как > (геад1іпе). 


Вот пример использования ореп?: 


иѕе ІРС: :Ореп2; 

Іоса1 (+Веадег, *Мгіїег), 

фріа = ореп2(\*Веадег, \*Мгатег, "бс -1") 

фзит = 2; 

Рог (1..5) { 
ргіпЕ Мгітег “$зит * $зит\п”; 
сһотр(%ѕип = <Неадег>); 

} 

с105е Мгіїег; 

с1Іоѕе Веадег; 

маіїріа($ріа, 0); 

рг1пЕ “сумма равна $зит\п” 


Можно также вызывать автовивификацию лексических дескрипторов файлов: 


ту ($Ейгеад, Ф#һмгіте); 
$р19 = ореп2($Ғһгеай, $Епига{е, “саф -и -п”); 


Проблема здесь в целом связана с тем, что стандартная буферизация ввода/выво- 
да испортит вам настроение на весь день. Хотя буфер дескриптора файла вывода 
выталкивается автоматически (это делает библиотека) и процесс на другом конце 
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получает данные своевременно, обычно никакими силами нельзя заставить адре- 
сата оказать взаимную любезность. В данном конкретном случае нам повезло: Рс 
рассчитывает на работу через канал (ріре) и умеет выталкивать буфер для каж 

дой выводимой строки. Но мало какие команды действуют именно так, поэтому 
такой способ редко срабатывает, если толькс не вы сами написали программу, 
находящуюся на другом конце двунаправленного канала. Даже простые и, оче- 
видно, интерактивные программы, такие как ѓір, здесь пасуют, поскольку в них 
не применяется построчная буферизация канала; лишь построчная буферизация 
устройства у. 

На помощь могут придти модули 10::Рту и Ехрест из СРАМ, которые предоставля- 
ют устройство іќу (фактически псевдоустройство іу, но оно действует как настоя- 
щее). Благодаря этому мы получаем построчную буферизацию в другом процес- 
се, не модифицируя его. 


Если потребуется разбить программу на несколько процессов и для каждого обес- 
печить возможность двустороннего общения, то из попытки использовать для 
этого интерфейсы каналов высокого уровня ничего не выйдет, потому что все 
они — однонаправленные. Потребуется два вызова низкоуровневой функции р1ре, 
по одному на каждое направление передачи: 


раре(РАОМ_РАВЕМТ, ТО СНІІ0) 11 іе “р1ре: $! ; 
рзре(РНОМ_СНТЕО, ТО РАВЕМТ) || іе "ріре: $! "; 
ѕе1есї( (ѕе1есі(тО_ СНІГ0), $| = 1))[0]); # автоматическое выталкивание 
ѕе1есї( (ѕе1есї(Т0 РАВЕМТ), $| = 1))[0]); # автоматическое выталкивание 


1 ($р19 = Ғогк) { 
с1оѕе ЕВОМ_РАНЕКТ; с10зе ТО_РАВЕМТ; 
ргіпе ТО_СНТЕО “Родительский процесс Ріс $$ отправляет это\п” 
сһотр($1іпе = <ЕВОМ_СНИ.0х); 
ргіпі "Родительский процесс Рій $$ только что прочел: $11пе`\п”; 
с1оѕе РВОМ_СНТЕО; с1оѕе ТО СНІЕО; 
иа1+р19($р19,0); 

} е1зе { 
біе ‘невозможно ветвление: $!” ип1еѕѕ деғіпед $ріа; 
с1оѕе ЕВОМ_СНТЕО; с10зе ТО СНІ 0; 
спотр($11іпе = <ҒАОМ РАВЕМТ>); 
ргіпі "Порожденный процесс Рід $$ только что прочел: `$11пе’\п”; 
ргіпїі ТО_РАВЕМТ “Порожденный процесс Рід $$ отправляет это\п”; 
с1оѕе РАОМ_РАНЕМТ; с10о$е ТО _РАВЕМТ; 
ехії; 


} 


Во многих системах ОМІХ не требуется выполнять два отдельных вызова ріре, 
чтобы установить полнодуплексную связь между родительским и порожденным 
процессами. Системный вызов ѕ0скеїраіг обеспечивает двусторонние соединения 
между связанными процессами на одной и той же машине. Поэтому вместо двух 
каналов достаточно одной пары сокетов. 


иѕе Ѕоскеї; 
ѕоскеїраіг(Сһі10, Рагепт, АЕ МІХ, 50СК ЅТАЕАМ, РЕ_ЏМ№РЕС) 
|| діе "ѕоскеїраіг: $! "; 


# или позвольте Рег1 выбрать имена файлов за вас 
ту ($Кіағћ, $даағһ); 
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ѕоскеїраіг($кіағһ, $даағһ, АЕ МІХ, 50СК_ЭТВЕАМ, РЕ_ИОМ№$РЕС) 
|| діе “ѕоскеїраіг: $! "; 


После вызова Тогк родительский процесс закрывает указатель Рагепї и осуществ- 
ляет чтение и запись через указатель (11149. Между тем порожденный процесс за- 
крывает указатель (1114, после чего читает и записывает через указатель Рагепі. 


Если двунаправленная связь интересует вас потому, что процесс-адресат реали- 
зован как стандартная служба Интернета, то, вероятно, следует отказаться от по- 
средников и применить модуль СРАМ, предназначенный специально для этой це- 
ли. (Перечень некоторых модулей такого рода приведен в разделе «Сокеты».) 


Именованные каналы 


Именованный канал (патеа ріре), часто называемый ЕІЕО!, является механиз- 
мом обмена данными между неродственными процессами на одной и той же ма- 
шине. Имена «именованных» каналов сохраняются в файловой системе, и это 
просто необычный способ сказать, что в пространство имен файловой системы 
можно поместить особый файл, за которым стоит не диск, а некий процесс.? ЕТО 
удобно использовать, когда необходимо соединиться с неродственным процессом. 
Процесс, открывающий ЕІЕО, блокируется до тех пор, пока не появится процесс 
на другом конце. То есть, если читающий процесс откроет ЕІЕО первым, он забло- 
кируется, пока не появится пишущий процесс, и наоборот. 


Для создания именованного канала используйте функцию РОШХ пктіто — разу- 
меется, если ваша система поддерживает стандарт РОЅІХ. Пользователям систем 
М!сговоЁ придется заглянуть в модуль \1п32::Р1ре, который, несмотря на назва- 
ние, создает как раз именованные каналы. (Анонимные каналы пользователи 
\У!1т32 создают, как и все мы, посредством ріре.) 


Допустим, например, что каждая операция чтения из файла .ѕідпаѓиғе должна 
возвращать новый результат. Сделайте файл именованным каналом, на другом 
конце которого сидит программа Рег! и «выплевывает» случайным образом вы- 
бранные мудрые изречения. Теперь, когда любая программа (почтовая, для чте- 
ния телеконференций, НЯпеег и т. д.) попытается прочесть этот файл, она подклю- 
чится к нашей программе и получит динамически созданную подпись. 


В следующем примере используется редко встречающийся оператор проверки 
файла -р, чтобы выяснить, не удален ли кем-нибудь (или чем-нибудь) наш канал 
ЕТРО.3 Если да, то нечего и пытаться открыть его, и мы рассматриваем это как по- 
вод для завершения. Вызови мы простую функцию орег в режиме "> $#раїћ", воз- 
никла бы ситуация гонки, чреватая риском создания обычногс файла .ѕіспаѓиге, 
если бы он отсутствовал между проверкой -р и вызовом ореп. Режим "+< $#раїћ” 
тоже не годится, потому что открытие ЕІЕО (и только ЕТРО) для чтения-записи не 
является блокирующим. Вызвав зузореп без флага 0_СВЕАТ, мы обойдем эту пробле- 
му, и файл ни при каких обстоятельствах не будет создаваться случайно. 


1 Еігәё Ш Еге Оиё – первым пришел, первым ушел. – Прим. перев. 
То же можно делать для сокетов домена СМІХ, но с ними нельзя использовать ореп 


С его помощью можно также проверить связь некоторого дескриптора с каналом, име- 
нованным или безымянным, например -р $ТО1М. 
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изе Есп{1, # для зузореп 
Сһаіг; # в исходный каталог 
$Ғраїһ = *. ѕідпаїџге"; 
ФЕМУ{РАТН} .= * : /иѕг/датеѕ”; 
ип1еѕѕ (-р $#раїћ) { # не канал, 
і? (-е _) { на что-то иное 
91е "$0: не буду перезаписывать . з1дпафиге\п” 
} е1зе { 


гедиіге РОЅІХ; 
РОЅІХ: :ткҒіғо(ФҒратһ, 0666) || діе “невозможно создать $#ратћ: $!" 
магп "$0: создан именованный канал $#ратћ\п” 


} 


ипПе (1) { 
я выйти, если файл .5з1дпатиге удален вручную 
01е "Файл канала исчез” ип1еѕѕ -р $#ра+ћ; 
# следующая строка заблокирует выполнение, пока не появится читатель 
зузореп(ЕТЕО, $Ррати, 0_ИВОМІҮ) 
|| діе "невозможно открыть для записи $#раїћ: $!” 
ргіпі РЕТРО "Јоһл 5тіїһ (ѕтіїћ\@һоѕі. ого) \п”, ‘Рогтипе -$`; 
с1оѕе ЕТЕО; 
ѕе1есі(ипдеғ, ипде?, ипдет, 0.2); # приостановка на 1/5 секунды 


} 


Небольшая пауза после закрытия нужна, чтобы дать читающему процессу воз- 
можность прочесть то, что записано. Если сразу повторить цикл и снова открыть 
ЕГО, прежде чем читающий процесс закончит чтение только что переданных 
данных, он не увидит признак конца файла, так как в работу снова вступит пи- 
шущий процесс. Так мы и будем ходить по кругу, пока на какой-нибудь итерации 
пишущий процесс немного не отстанет и читающий процесс наконец не увидит 
этот неуловимый конец файла. (А мы беспокоились о ситуации гонки!) 


зу ет \ ІРС 


Ѕуѕёет У ТРС ненавидят все. Этот механизм работает медленнее, чем перфокарты, 
прирезает для себя коварные маленькие пространства имен, совершенно не свя- 
занные с файловой системой, использует для именования своих объектов враждеб- 
ные человеческому восприятию числа и постоянно теряет ход собственных мыс- 
лей. Очень часто перед системным администратором встает задача «найти и унич- 
тожить»: выследить потерянные объекты ЗузУ ТРС с помощью #рс$() и убить их 
с помощью ірсгт(1) – по возможности раньше, чем кончится системная память. 


Несмотря на все эти муки, древний ГРС 5уѕУ все же имеет ряд возможных приме- 
нений. Перечислим три типа объектов ГРС: совместно используемая память, се- 
мафоры и сообщения. Для передачи сообщений предпочтительным механизмом 
сегодня являются сокеты, которые также имеют значительно более высокую пе- 
реносимость. Для простых семафоров обычно используется файловая система. 
А что касается совместно используемой памяти, то это решать вам. Если у вас 
есть в ней потребность, то более современный вызов ттар(2) вам поможет, хотя 
качество его реализации зависит от используемой системы. Требуется также про- 
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являть некоторую осторожность, чтобы Ре! не переместил ваши строки из того 
места, куда их положит ттир(2). 


Модуль Ғі1е::Мар из архива СРАМ существенно упрощает работу. Он по-прежнему 
требует некоторой осторожности, но если вы что-то упустите из виду, он просто 
выведет сообщение, вместо того чтобы свалить ядро с оптибкой нарушения прав 
доступа к памяти (ѕевтепќаёіор у1о]аНоп). 


Ниже приводится небольшая программа, демонстрирующая управляемый доступ 
к буферу совместно используемой памяти целого «выводка» процессов-братьев. 
Объекты буѕУ ІРС могут совместно использоваться и неродственными процесса- 
ми на одном и том же компьютере, но тогда придется решить, как они буду“ друг 
друга определять. Для безопасности мы создадим для каждого по семафору.! 


Перед каждой операцией чтения или записи в совместно используемук, память 
необходимо сначала пройти семафор. Это может стать довольно утомительным, 
поэтому создадим для доступа объект-обертку. Модуль ІРС::Ѕһагеаб1е идет на шаг 
дальше, оборачивая свой класс объектов в интерфейс їіе. 


Эта программа выполняется, пока вы не прервете ее с помощью комбинации 
Сопго[-С или эквивалентной: 


#1 /изг/бріп/рег1 -м 

иѕе %5. 6.0; # или выше 

иѕе $Ёг1Ст; 

иѕе ѕідігар ом(діе ІМТ ТЕВМ НУР ОТ); 

ту Ф$РАОСЕМҮ = ЅћіҒі (@АВСУ) || 3; 

ема1 { таіп() }; # смотрите ниже в ОЕЗТНОУ, зачем это нужно 
91е іҒ $@ && $6 !- /`СацдвЕ а 516/; 

рг1пЕ “\пропе. \п”; 

ехії; 


зиб таіп { 
ту $тет = $ҺМет->а110с( "Ог1д1па1 Сгеаї1оп аї Іоса1ї1пе); 
пу(@кіаѕ, Фсһі1а); 
Ф5І0{СНІЮ} = “ІСМОВЕ" 
Ғог (ту Фипрогп = $РАОбЕМУ; фипрогп > 0; Фипбогп--) { 
1Ё (Фсһі1а = ёогк) { 
ргіпі “$$ запущен порожденный процесс Фсһі10\п” 
пехї; 
} 
діе “невозможно ветвление: $!" ип1іеѕѕ деғіпед $сһі1а: 
е\а1 { 
мһі1е (1) { 
$тет->10сК(); 
$тет->роке( "$$ . 1оса1+іпте) 
ип1ев5 $тет->реек =- /7$%$\0/о, 
$тет->ип1оск( ); 


Практичнее было бы создать пару семафоров для каждой области памяти совместного 
доступа - по одному для чтения и записи. Фактически это и делает модуль ІРС::Ѕћагеаб1е 
из СРАМ. Но мы стараемся сохранить простоту. Стоит, однако, признать, что с помо- 
щью пары семафоров можно было бы воспользоваться единственной, пожалуй, при- 
влекательной особенностью Зу$У ІРС – возможностью выполнять атомарные операции 
над целыми группами семафоров, что иногда полезно. 
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у: 
діє 11 $0 && $@ !- /7Саодһї а $Тб/; 
ехі1; # выход из порожденного процесса 


} 


мћіЈе (1) { 
ргіпі “Содержимое буфера “, Фтет->де+, “\п” 
ѕ1еер 1 

} 


} 


А вот листинг пакета ЅћМет, используемого в программе. Его можно поместить 
в конец программы или в отдельный файл (с вызовом `1, “ в конце) и загрузить из 
основной программы посредством гедилге. (Два модуля ГРС, используемые в нем, 
присутствуют в стандартном дистрибутиве Рен.) 


раскаде ЅһМеп, 

изе ІРС::5уѕу дм(ІРС РВІМАТЕ ТРС_АМТО ТРС_СНЕАТ $_ТВИХУ); 
изе ІРС: : Зетарпоге; 

500 МАХВУИЕ() { 2000 } 


зи а110с { # метод конструктора 
ту $с1а55 = 5һ1ҒЕ(); 
пу Фуаше = @ ? ѕһіЁҒ() : “ 


ту $Кеу = ѕһтодет(ІРС РАІУАТЕ, МАХВОЕ, $_ТВМХУ) || іе "ѕһтдеї: $!", 
ту Фѕет = ТРС: : Зетарпоге->пем( ТРС_РАТУАТЕ, 1, $ ТВИХИ | ІРС СВЕАТ) 

|| 91е “ТРС: :Ѕетарһоге->пем $!7; 
$зет->зе1\а1(0,1) || д1е "ѕет зефуа1: $!", 


пу $5е1# = 01еѕѕ { 


ОММЕВ => $$, 

ЭНМКЕУ => $Кеу, 

ЅЕМА => $эеп, 
} => $с1а; 


$5е1ғ->риї($уа]ие); 
гефигп $5е1# 


} 


Теперь о методах чтения и записи. Методы 56е: и р. блокируют буфер, а реек 
и роке - нет, поэтому последние два должны применяться, только когда объект за- 
блокирован вручную, что приходится делать, если необходимо извлечь старое 
значение и записать обратно модифицированное — все в рамках одной и той же 
блокировки. Демонстрационная программа именно это и делает в цикле мђі1е (1). 
Транзакция целиком должна происходить под действием одной и той же блоки- 
ровки, иначе проверка и установка не будут атомарными и способны стать бомбой. 


зир дет { 
пу фѕе1# = зВ1РЕ(); 
фѕе1#->10ск; 
пу $уа1ие = $ѕе1ғ->реек(@ ); 
фѕе1?->ип1оск; 
геъигп $уа1ие; 

} 

ѕир реек { 
пу $зе1 = ЅһіҒ1( ); 
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эптгеад ($5$е11->{ЭНМКЕУ}, ту ФБиРТ=4(), 0, МАХВУЕ) || 91е "ѕһтгеад: $'” 
зирѕг(Фоиғ?, 1пдех($ьитР, “\0”)) = 9(); 
гефигп Фи: 


ѕир рит { 
пу $3е1# = ѕһіҒЕ(); 
ф5е1#->10ск, 
ф5е1#->роке(@ ); 
фѕе1?->ип1оск; 


ѕир роке { 
ту($е1ғ, $159) = @ ; 
ѕһтмгісе($ѕе1?->{НМКЕҮ} $тз9 0, МАХВУЕ) || діе "“ѕһтмгіїе: $!” 


зиб 1оск { 
ту Фѕе1ғ = ѕһіті(); 
$5е1#-> {ЕМА} ->ор(0, -1,0) || діе “зетор: $! 


ѕир ип1оск { 
пу ф561# = ѕһіғт(); 
фѕе1ғ->{$ЕМА}->0р(0, 1,0) || діе "ѕетор: $!" 
} 


Наконец, классу нужен деструктор, чтобы после того как объект закончит свое 
существование, можно было вручную освободить совместно используемую па- 
мять и семафор, хранящийся внутри объекта. В противном случае они переживут 
своего создателя, и, чтобы избавиться от них, придется прибегнуть к ірсѕ и ірсгт 
(или помощи системного администратора). Вот почему в основной программе мы 
пошли на создание сложных оберток, преобразующих сигналы в исключитель- 
ные ситуации: чтобы выполнились все деструкторы, из памяти были удалены 
объекты ЗузУ ІРС, а системные администраторы не занимались нашими делами. 


ѕир БЕЗТВОУ { 
ту $ѕе1# = =һіҒғЕ(); 


геїигп ип1еѕ5 $ѕе1#->{ОММЕВ} == $$ # избежать "овтора освоб^ждения памяти 
ѕһтсі1($5е1#-> {ЅНМКЕҮ }, ІРС ВМТО 0` мат "5ғтсЕ АМІО: $ 
фѕе1ғ-> {ЕМА} ->гетоме( ) мап ‘зета->гетоме $! 
} 
Сокеты 


Механизмы ГРС, обсуждавшиеся выше, имеют одно жесткое ограничение: они 
предназначены для организации связи между процессами, выполняющимися на 
одном и том же компьютере. (Несмотря на то что иногда доступ к файлам может 
осуществляться с нескольких машин, если используются механизмы типа МЕБ 
(сетевой файловой системы), во многих реализациях МЕВ блокировка не работа- 
ет, что лишает одновременный доступ почти всей привлекательности.) Для орга- 
низации сетевого взаимодействия общего назначения следует выбирать сокеты. 
Хотя сокеты (зосКеёз) были придуманы для В8р, они быстро распространились на 
другие виды ОМТХ, а в наше время интерфейс сокетов можно найти почти в лю- 
бой «жизнеспособной» операционной системе. Если на машине не поддерживают- 
ся сокеты, возникнут колоссальные трудности при работе с Интернетом. 
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С помощью сокетов можно создавать виртуальные контуры (в виде потоков ТСР) 
и обмениваться датаграммами (в виде пакетов ОЮР). В зависимости от типа сис- 
темы могут существовать и другие возможности. Но самый распространенный 
способ программирования сокетов — использование ТСР через сокеты домена Ин- 
тернета, о чем мы здесь и расскажем. Такие сокеты предоставляют надежные со- 
единения, работающие подобно двунаправленным каналам, но не ограниченные 
локальной машиной. Оба главных приложения Интернета, электронная почта 
и браузеры, почти во всем полагаются только на сокеты ТСР. 


Вы также интенсивно используете ОР, не подозревая об этом. Всякий раз когда 
ваш компьютер пытается найти сайт в Интернете, он передает пакеты ОПР серве- 
ру О№, запрашивая фактический [Р-адрес. Вы и сами можете использовать ОПР, 
если захотите отправлять и принимать датаграммы. Датаграммы обходятся де- 
шевле, чем соединения ТСР, именно потому, что они не ориентированы на соеди- 
нение; иначе говоря, они меньше похожи на звонок по телефону и больше – на 
попадание письма в почтовый ящик. Однако в ОПР нет той надежности, которую 
предоставляет ТСР, из-за чего ОБР лучше подходит для ситуаций, когда неваж- 
но, что пара пакетов помялась, проколота или разорвана. Или когда известно, что 
некоторый протокол более высокого уровня обеспечит какую-то меру избыточно- 
сти или амортизации отказов (именно так поступает ОМВ.) 


Есть и другие возможности, но к ним обращаются значительно реже. Можно так- 
же использовать сокеты домена ОМІХ, но только для локального взаимодейст- 
вия. Различные системы поддерживают другие протоколы, не основанные на [Р. 
Несомненно, что где-то и для кого-то такие протоколы представляют интерес, но 
мы воздержимся от разговора о них. 


Имена функций для сокетов в Рег! совпадают с именами соответствующих сис- 
темных вызовов С, но аргументы функций обычно отличаются. На то есть две 
причины: во-первых, дескрипторы файлов Ре! действуют иначе, чем дескрипто- 
ры файлов в языке С; и, во-вторых, Рег| уже знает длину своих строк, поэтому 
такую информацию передавать не нужно. Подробные сведения обо всех систем- 
ных вызовах, касающихся сокетов, можно найти в главе 27. 


Старый код на Рей с применением функций сокетов характеризует, в частности, 
проблема жестко закодированных значений констант, используемых при вызовах 
функций: такой подход уничтожает переносимость. Подобно большинству систем- 
ных вызовов, функции сокетов тихо, но вежливо возвращают в случае неудачи 
ипое?, а не порождают исключение. Как следствие, крайне важно проверять воз- 
вращаемые значения этих функций, поскольку они не станут слишком шуметь, 
получив от вас мусор вместо нормальных аргументов. Встретив код, где, скажем, 
явным образом устанавливается значение $АҒ ІМЕТ = 2, имейте в виду — у вас круп- 
ные неприятности. Неизмеримо выше стоит подход, при котором используется мо- 
дуль Ѕ0скеї или еще более дружелюбный модуль 10::50скеї — оба стандартные. Эти 
модули предоставляют различные константы и вспомогательные функции для 
настройки клиентов и серверов. Наибольшего успеха программы, работающие 
с сокетами, добьются, если всегда будут начинаться следующим образом (и не за- 
будьте ключ проверки меченых данных -Т в строке #! для серверов): 


#1! /иѕг/ріп/рег]1 
иѕе %5. 14, 

иѕе магпіпдѕ; 
изе аитодіе; 
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# или І0::5оскеї::ІР из СРАМ для поддержки ТРуб 
изе 10; :5оскет; 


Как отмечается в тексте книги, поведение Рег! в плане взаимодействия с операци- 
онной системой в значительной мере зависит от библиотек С, и не все системы под- 
держивают все разновидности сокетов. Безопаснее всего придерживаться обыч- 
ных операций через сокеты с ТСР и ОПР. Например, если нужна какая-то вероят- 
ность, что код удастся впоследствии перенести на системы, о которых никто не 
думал в момент разработки, не полагайтесь на поддержку надежного протокола 
упорядоченных пакетов. Также не следует передавать дескрипторы открытых 
файлов между неродственными процессами через локальный сокет домена ОМХ. 
(Да, на многих ОМГХ-машинах это возможно — посмотрите страницу руководства 
гесотзЕ(2).) 


Если требуется просто использовать стандартную службу Интернета, например 
электронную почту, телеконференции, службу доменных имен, ЕТР, Теіпеё, \Меь 
ит. д., не начинайте с чистого листа. Вместо этого попробуйте использовать мо- 
дули СРАМ. Для этих целей уже существуют такие модули, как №1::5МТР (или 
Маі1::Маі1ег), № ет: :ММТР, Мес: :0№, №1: :ЕТР, №: Те1пеї и различные модули поддерж- 
ки НТТР. Комплекты модулей, 1ібпеї и 116ми\м, содержат много отдельных моду- 
лей для работы в сети. 


В последующих разделах мы представим несколько примеров клиентов и серве- 
ров, не слишком подробно объясняя каждую функцию, так как для этого при- 
шлось бы повторить описания, имеющиеся в главе 27. 


Сетевые клиенты 


Используйте сокеты домена Интернета, если вам нужна надежная связь клиент- 
сервер между потенциально различными машинами. 


Для создания клиента ТСР, который соединяется с каким-то сервером, проще ис- 
пользовать стандартный модуль 10::50скеї: :ІМ№ЕТ: 


#1 /иѕг/ріп/епу рег1 
џѕе 5.14, 

иѕе магп1пд$; 

изе аџїоаіе; 

иѕе ТО: :Зоскет: : ТМЕТ, 


ту $гетоте һоѕї = "1оса1һоѕї”; # замените действительным именем удаленного узла 
ту $гетоте_рог{ = “дау ме“; # замените названием службы или номером порта 


ту $ѕоскеї = 10: :Ѕоскеї: : ІМЕТ->пем( 
РеегАдаг => $гетоїе_һоѕї, 
РеегРогЕ => $гепоїе_рогї, 
Туре => ЅОСК ЅТВЕАМ 
); 


# послать что-то через сокет; в сети принято использовать СВЕЕ 
# служба Пауїіте не принимает входные данные, но они могут требоваться другим службам 
ргіпї $зоскеф “Почему ты мне больше не звонишь? \ г\п” 


# прочесть ответ удаленной машины 
ту Фапзиег = <$ѕоскеї> =- $/\\2//г: 
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ѕау “Получен ответ: $апѕмег" 


# и по окончании завершить соединение. 
с105е($ѕоскеї); 


Если у нас есть имя узла и номер порта для подключения, а для остальных полей 
мы готовы оставить значения по умолчанию, достаточно сокращенной формы вы- 
зова: 


фѕоскеї = І0: :5оскеї: :ІМЕТ->пем( “ммм. уаһоо. сот: 8С") 
ог діе “Невозможно соединиться с портом 80 нг уаћоо: $! , 


Для работы с протоколом ІРуб проще всего использовать модуль 10::50скеї::ІЕ из 
СРАМ. В версиях Рей выше у5.14 этот модуль может быть даже включен в стан- 
дартную библиотеку. После того как вы получите указанный модуль, останется 
лишь изменить имя класса в примере выше с 10::50скеї::ІМЕТ на 10::50скеї::Ір, и он 
станет поддерживать также протокол ГРуб. Этот класс обладает дополнительным 
методом зоскдота1п, который позволяет выяснить, какая используется версия 
протокола ГР: 


#1 /иѕг/ріп/епу рег] 
иѕе %5. 14, 

иѕе магп1п9$; 

џѕе ацтоа1е; 

изе 10: :5оскеї: :ІР; 


ту $гетоте_һоѕї = “1оса1һоѕї”; 
ту Фгетоте_рогї = “"дауііпе"; 


ту $ѕоскеї = 10: :50сКеї: : 1Р->пем( 
РеегАайг => $гепоте_һоѕ+, 
РеегРогї => $гепоїе_рогт, 
Туре => ОСК ЅТВЕАМ, 
№ 


ту $Гата1упаме = ( $ѕоскет->ѕоскаота1п == АР _1№Е!б ) ? “ТРуб` 
( $зоскет->зоскаота1п == АР_ТМЕТ ) ? "ТР\4' 
“неизвестно”; 


ѕау "Соединение с $гетоте_позт : $гетоте_рогт установлено через $Рат1] упапе; 


# отправить что-нибудь через сокет: в сети принято использовать СВЕР 
ргіпї $ѕоскеї "Почему ты мне не звонишь?\г\п”; 


# прочесть ответ удаленной машины 
ту Фапзмег = <$ѕоскеї> =- з/\В\2//г; 


зау ” Получен ответ’ $апѕмег” 


# и по окончании завершить соединение. 
с10ѕе($ѕоскеї); 


Чтобы соединиться с помощью базового модуля Ѕ0скеї. 


иѕе %5. 14, 
иѕе магпіпоѕ; 
и5е аиїодіе; 
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изе Ѕоскеї; 


ту $гетофе_позЕ = "1оса1һоѕї”; 
пу Фгепоёе рогї = 13; # порт службы даутіте 


ѕоскеї(ту $ѕоскеї, РЕ ІМЕТ, $0СК ЅТВЕАМ, детрготобупате("Еср”)); 
ту $іпіегпеї адаг = іпеі атоп($гепоте һоѕї); 
ту $радаг = ѕоскадаг іп($гетоїе рогі, фіпїегпет_адаг); 


соппесі(Фѕоскеї, $радйг), 
фѕоскеї->аитоғ1иѕћ( 1); 


ргіпі $ѕоскеї "Почему ты мне не звонишь? \ т\п" 
пу Фапзиег = <$ѕоскеї> = з/\В\2//е; 


ѕау "Получен ответ: ". $апзмег 


Стандартный модуль 50скєеї, входящий в состав у5.14, можно использовать и для 
работы с протоколом ТРуб, но вызовы функций и АРІ будут несколько отличать- 
ся от примера выше, который предназначен для работы исключительно с ІРу4. 
Подробности читайте в разделе Ѕоскеѓ справочного руководства. 


Если необходимо закрыть соединение только со своей стороны, чтобы на удален- 
ном конце был получен конец файла, но сохранить возможность чтения данных, 
поступающих с сервера, используйте системный вызов ѕһиїйомп для полузакры- 
тия: 


# больше не выводить данные на сервер 
ѕһисаомп( $50сКеї, 1); # константа Ѕоскеї: :$НОТ_МА в %5.6 


Сетевые серверы 


В продолжение приведем соответствующий сервер. Его довольнс просто реализс- 
вать посредством стандартного класса 10::50скет::ІМЕТ: 


иѕе ТО: :5оскеї: : ТМЕТ; 

фѕегмег = І0::5оскеї ІМЕТ->пем(іоса1Рогї => $ѕегуег_ ро"? 
Туре => Ѕ0СК_ЅТВЕАМ, 
Неизе => 1 


і15їеп => 10 ) # или ЅОМАХСОМ№М 
|| оле "Невозможно стать сервером їср на порту фѕегуег рогі: $! \п" 


мһіЈе ($с11еп{ = фѕегуег->ассерї()) { 
# Фс1іепї является новым соединением 


} 


с1оѕе($ѕегмег); 
Можно написать это и с помощью модуля более низкого уровня — 50сКкет: 


#1 /оѕг/ріп/епу рег1 


иѕе \5. 14 
изе магпіпоѕ; 
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изе аџїодіе, 
иѕе Ѕоскеї; 


пу $ѕегмег рогі = 12345; # выберите номер 


# создать сокет 
зоскее(ту $зегуег РЕ МЕТ. $0СК ЅТВЕАМ, детрготобупате( "ср" )); 


# чтобы можно было быстро перезапустить сервер 
ѕеїѕоскорї($ѕегуег, 501 ЅОСКЕТ, $0_ВЕОЗЕАООВ, 1); 


# сконструировать адрес моего сокета 
ту фомп_ адаг = ѕоскайаг іп($ѕегуег рогі, ТМАОБВ_АМУ); 
ріпа($ѕегмег, Фомп_а9дг); 


# организовать очередь для входящих соединений 
1іѕтеп( $ѕегмег. ЅОМАХСОММ): 


# принимать и обрабатывать соединения 
мһі1е (ассерї(ту $с1іепї, $зегуег)) { 

# сделать что-нибудь с новым соединением $с1іепї 
} сопііпие { 

с1оѕе $с1іепї; 


} 


с10ѕе($ѕегмег); 


Клиенту не требуется привязываться к какому-либо адресу вызовом 0110, а вот 
серверу это нужно. Мы задали его адрес как ТМАООВ_АМУ, и это значит, что клиенты 
могут соединяться через любой имеющийся сетевой интерфейс. Чтобы работать 
через конкретный интерфейс (например, через внешний интерфейс машины- 
шлюза или брандмауэра), используйте действительный адрес этого интерфейса. 
(Клиенты тоже могут это делать. но им этс редко требуется.) 


Чтобы узнать, что за машина с вами соединилась, вызовите функцию детреегпате 
для соединения с клиентом. Она возвращает ІР-адрес, который придется само- 
стоятельно перевести в имя (если получится): 


изе Ѕоскеї; 
Фотћег_епа = деёреегпате($с1іепт) 

|| іе "Невозможно идентифицировать клиента. $! \= 
($рогі, Ффіадаг) = ипраск_зоскадаг 1п($огпег епа); 
фасіџа1 ір = іпеї пїоа($іадаг) 
$с1а1тед_позТпате = детһоѕїіруаддг($іааог АЕ ІМЕТ); 


Здесь имеется тривиальная возможность обмана, поскольку владелец этого ТР- 
адреса может так настроить свои таблицы обратной трансляции адресов, что они 
будут говорить все что угодно. В качестве некоторой дополнительной меры на- 
дежности оттранслируйте результат в обратном направлении: 


@пате_1о0кир = деїћоѕїірупате($с1аітед һоѕіпате) 

|| діе “Невозможно получить адрес $с1аіпед һоѕіпате: $! \п” 
@гезо1\уед_1рз = тар { іпеї пїоа($ ) } @пате_1оокир[ 4 . $#пате_10окир ]; 
фтідһі_ѕроо? = !дгер { $асіџа1 ір ед $ } @гезо]уед_1р$; 
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Когда клиент соединится с сервером, сервер сможет осуществлять ввод/вывод че- 
рез дескриптор этого клиента. Но, пока сервер будет заниматься этим, он не смо- 
жет обслуживать последующие запросы, поступающие от других клиентов. Что- 
бы не ограничиваться обслуживанием единственного клиента, многие серверы 
немедленно создают свою копию вызовом Тогк для обработки каждого входящего 
соединения. (Другие выполняют ветвление заранее или мультиплексируют ввод/ 
вывод между несколькими клиентами посредством системного вызова зе]ест.) 


ВЕСЦЕЗТ. 
мһі1е (ассері(ту $с1іепі => $ѕегмег)) { 
і? ($кіарід = Ғогк) { 
с1оѕе $с1іепї; # родитель закрывает неиспользуемый дескриптор 
пехЕ НЕСЦЕЗТ; 
} 
деғіпей($кідрід) || діе ' невозможно выполнить Тогк: $! 


с1оѕе $зегуег; # потомок закрывает неиспользуемый дескриптор 
фс1іепї->аџіо#1и$%ћ(1); 

# ввод/вывод через указатель $с11епї кода порожденного процесса 

# для каждого соединения 

фіпри? = <%с1іепї>; 

ргіпс $с1іепі "оџіриї\п"; # или ЗТООЦЧТ, то же самое 

ореп(5ТОоТМ, “<&”, $сЈіепї) || 91е “сап` дир с11епе: $1”; 
ореп(5ТроуТ, “>8”, $с1іепї) || діе “сап` дир с1іепї: $! 
ореп(ЅТрЕВВ. “>&”. Фс11епї) || діе “сап 'ї дир с1іепі: $! 


# запустим калькулятор, только для примера, 


ѕуѕзтет( "рс -1“); # или что вам угодно, лишь бы не было 
# управляющих символов для интерпретатора команд! 
ргіпі "допе\п”; # все еще клиенту 


с1оѕе $с11ет{; 
ехії; # не пускать порожденный процесс назад к ассерї! 


} 


Для каждого поступившего запроса этот сервер запускает порожденный процесс 
через Гогк. Благодаря этому он может одновременно обрабатывать много запро- 
сов, пока сохраняется возможность создавать новые процессы. (Возможно, вы за- 
хотите ограничить число одновременных запросов.) Даже если не выполнять 
Гогк, функция 1іѕіеп разрешает до $0МАХСОМ\ (обычно пяти или более) ожидающих 
соединений. Каждое соединение использует некоторые ресурсы, хотя и в мень- 
шем объеме, чем процесс. Серверы с разделением на процессы должны заботить- 
ся об уборке своих отработавших потомков (называемых «зомби» на жаргоне 
МІХ), иначе они быстро заполнят всю таблицу процессов. За вас это может сде- 
лать код НЕАРЕВ, обсуждавитийся в разделе «Сигналы», либо вы сами можете при- 
своить $5106{СНЕО} = “ТСМВЕ". 


Прежде чем выполнить новую команду, мы подключаем стандартные устройства. 
ввода, вывода (и вывода ошибок) к соединению с клиентом. В результате любая 
команда, читающая из 5Т0ІМ и пишущая в 5ТО00Т, сможет общаться с удаленной 
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машиной. Без переназначения команда не смогла бы найти дескриптор клиента, 
который по умолчанию закрывается при переходе через границу ехес. 


Если вы пишете сетевой сервер, мы настоятельно рекомендуем использовать ключ 
-Т для активации проверки меченых данных, даже если вы не вызываете ѕеіџій 
или 561919. Это всегда полезно для серверов или любых других программ, выпол- 
няемых от чужого имени (как все сценарии ССІ), поскольку уменьшает шансы по- 
сторонних проникнуть в вашу систему. Подробнее обо всем этом читайте в разделе 
«Обработка ненадежных данных» в главе 20. 


Одно дополнительное соображение, касающееся создания программ для Интер- 
нета: многие протоколы требуют, чтобы концом строки служила комбинация 
САІ Е, которую можно задать несколькими способами: “\г\п',1 "\015\012", "\х@\ха‘ 
или даже сћг(13).сһг(10). На практике многие программы в Интернете применяют 
в качестве окончания строки просто "\012", но лишь потому, что программы для 
Интернета обычно стараются быть либеральными в отношении того, что они при- 
нимают, и строгими в отношении того, что выдают. (Если бы только люди посту- 
пали так же...) 


Передача сообщений 


Как упоминалось выше, связь по протоколу ООР требует значительно меньших 
накладных расходов, но не обеспечивает надежности, поскольку не гарантирует 
поступление сообщений в правильном порядке (и вообще их поступление). Часто 
говорят, что ОПР означает ОпгеіаЫе Оабаёгат Ргофосо] – ненадежный протокол 
датаграмм?. 


Тем не менее ОПР имеет некоторые преимущества перед ТСР, в том числе возмож- 
ность широковещательной или групповой передачи сразу нескольким узлам 
(обычно в локальной сети). Если вы поймали себя на том, что излишне обеспокое- 
ны надежностью и начинаете встраивать проверки в свою систему передачи сооб- 
щений, то, возможно, следовало с самого начала использовать ТСР. Правда, рас- 
ходы на установление и разрыв соединения ТСР будут больше, но если удастся 
компенсировать их передачей большого числа сообщений (или одного длинного 
сообщения), этим обстоятельством можно пренебречь. 


Как бы то ни было, вот пример программы, использующей ОПР. Она связывается 
с портом ОРЮР службы времени на машинах, перечисленных в командной строке, 
или на всех, которые найдет с помощью широковещательного адреса, если аргу- 
менты не указаны.?3 Не на всех машинах включен сервер времени, особенно за гра- 
ницами брандмауэра, но в целом ожидается, что каждая вернет вам 4-байтное це- 
лое число (с порядком байтов в сетевом формате), представляющее текущее время 
по часам этой машины. Говоря точнее, возвращается число секунд, прошедших 
с 1900 года. Из этого числа нужно вычесть число секунд между 1900 и 1970 года- 
ми, чтобы передать это время функциям преобразования 10саіїіпе или оп 1те. 


1 За исключением доисторических, появившихся еще до ОМ№ІХ, систем Мас, которые, на- 
сколько нам известно, никто уже не использует. 


2 Вдействительности: Озег Раіавгат Ргоюсо!| – протокол пользовательских датаграмм. — 
Прим. перев. 


з Если это не работает, выполните команду іўсопѓіє -а, чтобы определить правильный 
локальный широковещательный адрес. 
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#1 /иѕг/біп/рег1 

# сІоскагіѓі – Сравнить показания часов в других системах с этой. 

# Если нет аргументов, передать время всем, кто слушает 
# Ждать ответа полсекунды. 

иѕе 5.14; 

иѕе маги1по3з; 

иѕе 5ЇїгіСЇ; 

иѕе Ѕоскеї; 


ипъпіТТ (©АВСУ, 1пет_птоа(ТМАБОВ_ВВОАОСА$Т)) 
ип1е55 @АНСУ; 


ѕоскеї (пу $тзазоск, РЕ_1мЕТ, 50СК_ РСВАМ. деїргоорупате( "иар" з) 
|| 91е “сокет: $!", 


# Требуется некоторым ‘неисправным” (Богкед)' машинам и не должно повредить остальным 
ѕеїѕоскорі ($тѕдѕоск, 501 ЅОСКЕТ, $0_ВВОАБСАЗТ, 1) 
|| діе “ѕеїѕоскорї: $! “; 


ту $рогїпо = деіѕегубупате("+іте", “идр” ) 
|| діе "нет порта идр службы времени “; 


Гог пу Ф+агде+ (@АВСУ) { 
ргіпе “Отправка $тагодет : $рогтпо\п”; 
пу $дезтрадаг = ѕоскабаг іп($рогіпо, іпеї_аїоп($агдеї)); 
зепа($тзозоск, "х”, 0, фаезтрадаг) 
|| Фіе “ѕепа: $! “; 
} 


# служба времени возвращает 32-разрядное число секунд с начала 1900 
ту ФЕВОМ_1900_ТО_ЕРОСН = 2_208_988_800; 
пу Філе пі = "№; в причем в этом двоичном формате 
пу $Е1те_1еп = 1епоћ(раск($1№іте Еті 1)) # годится любое число 


пу Фіптаѕк = 4); # строка для храчения битов ї:1епо длн ѕе1есї 
уес($1птазк, РіЛепо($т5050ск), 1) = 1 


# ждать появления входных дантых попсекунды 
мһі1е (ѕе1есі(ту $оиїтаѕк = $1птаѕк, ‹пдеғ, опоеѓ, 0.5)) { 
деғ1пед(ту $ѕгсрайаг = гесу($тзозоск, ту $ріпїі1те, $+1те Іеп, 0)) 
Н діе “гесу: $17; 
пу($рогЕ, фірадаг) = зоскадаг_1п($згсраддг); 
ту Фѕепдһоѕі = ѕргіпЕ? "%5 [%$]" 
деіһоѕіруаадг($іраддг, АЕ_ІМЕТ) || “ОМКМОММ” 
іпеї_піоа($ірадаг); 
ту $де1+а = џпраск($іте Ёт, фбіптіте) - 
ФЕНАОМ_1900_ТО_ЕРОСН - тлте(); 
ргіпі “Часы $ѕепдһоѕї спешат на $де1та секунд отн. данной системы. \п”; 


1 Вогҝкеа – эквивалент жаргонного слова «рогкеп», представляющего собой намеренно 
искажаемое хакерами «БгоКеп». – Прим. ред. 


Компиляция 


Те, кто пришел сюда в поисках компилятора Рей, могут удивиться, обнаружив, 
что он у них уже есть. Программа рей (обычно /иѕг/Біп/регі) уже содержит ком- 
пилятор Реп. Возможно, это не то, что вы думали, и если это так, вам будет при- 
ятно узнать, что мы предоставляем также генераторы кода (из лучших побужде- 
ний некоторые называют их «компиляторами»), которые обсудим ближе к концу 
главы. Но сначала поговорим о том, как мы представляем себе Компилятор. 
В этой главе нам неизбежно придется вникать в некоторые технические подроб- 
ности, причем кому-то они будут интересны, а кому-то — нет. Если вы принадле- 
жите к последним, то можете считать, что вам предоставлена возможность по- 
практиковаться в быстром чтении. 


Представьте себя дирижером, заказавшим партитуру большого оркестрового 
произведения. Получив заказ, вы обнаруживаете несколько десятков книжечек, 
по одной на каждого участника оркестра, с партиями отдельных инструментов, 
а главный экземпляр, содержащий все партии, отсутствует. Хуже того, все пар- 
тии, которые есть, написаны на обычном языке, а не с использованием нотной 
грамоты. Прежде чем составить программу выступления или даже раздать пар: 
тии оркестрантам, необходимо перевести эти описания в прозе в обычную систе: 
му записи нотного стана. Затем составить из отдельных частей одну гигантскую 
партитуру, чтобы получить представление о произведении в целом. 


Точно так же, если передать исходный код сценария Рей для выполнения про- 
грамме регі, компьютер извлечет из него не больше пользы, чем музыканты из 
описания симфонии на обычном языке. Прежде чем программа начнет выпол- 
няться, Ре должен скомпилировать! эти похожие на английский язык указания 
в специальное символическое представление. Но и это еще не начало выполнения 
программы, потому что компилятор только компилирует. Подобно партитуре, 
лежащей перед дирижером, вашей программе, даже после преобразования в фор- 
мат, пригодный для интерпретации, требуется активный агент, чтобы интерпре- 
тировать ее. 


1 Или транслировать, трансформировать, преобразовать, перевоплотить, превратить. 
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Жизненный цикл программ на Реп 


Жизненный цикл программы на Рег| можно разбить на четыре фазы, каждая из 
которых состоит из собственных этапов. Наибольший интерес представляют пер- 
вая и последняя фазы, а две другие являются необязательными. Фазы изображе- 
ны на рис. 16.1. 


Генерация Реконструкция дерева 
кода грамматического разбора 


Рис. 16.1. Жизненный цикл программы Рей 


1. Фаза компиляции 


Во время первой фазы, фазы компиляции, компилятор Рег! преобразует про- 
грамму в структуру данных, называемую деревом грамматического разбора 
(рагзе їгее). Наряду со стандартной технологией грамматическогс разбора, 
Реп применяет другую, значительно более мощную: для управления дальней- 
шей компиляцией он использует блоки ВЕСІМ. Они передаются интерпретатору 
сразу после разбора, и он выполняет их в порядке появления. В их число вхо- 
дят все объявления изе и по, представляющие собой скрытые блоки ВЕСІМ. Бло- 
ки ШЏМІТСНЕСК выполняются по окончании компиляции единицы компиля- 
ции — они используются для инициализации единиц компиляции. Выполне- 
ние всех блоков СНЕСК, ІМІТ и ЕМ№ откладывается компилятором на более позд- 
нее время. 


Лексические объявления отмечаются, но присваивание в них не производят- 
ся. На данном этапе компилируются все конструкции еуа1, ВЕОСК, 5///е и неин- 
терполируемые регулярные выражения, и вычисляются константные выра- 
жения. Работа компилятора на этом заканчивается, если только не потребует- 
ся вызвать его позже. В конце этой фазы снова вызывается интерпретатор, 
чтобы выполнить запланированные блоки СНЕСК в порядке, обратном их посту- 
плению. Наличие или отсутствие блока СНЕСК определяет, будет совершен пе- 
реход к фазе 2 или скачок к фазе 4. 


2. Фаза генерации кода (необязательная) 


Блоки СНЕСК устанавливаются генераторами кода, поэтому данная необяза- 
тельная фаза имеет место в случае явного использования одного из генерато- 
ров кода, описываемых далее в разделе «Генераторы кода» этой главы. Они 
преобразуют скомпилированную, но еще не запущенную программу в исход- 
ный код на языке С или последовательность байт-кодов Реті – значений, вы- 
ражающих внутренние инструкции Ре. Если вы решили создать исходный 
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код на С, то в конце концов из него можно создать файл на машинном языке, 
называемый исполняемым образом (ехесшаЫе ітасве). В этот момент ваша 
программа временно прекращает свои жизненные функции. После создания 
исполняемого образа можно сразу перейти к фазе 4; в противном случае потре 
буется подвергнуть полуфабрикат байт-кода восстановлению в фазе 3. 


Фаза реконструкции дерева грамматического разбора (необязательная) 


Чтобы реанимировать программу, нужно воссоздать ее дерево грамматическо- 
го разбора. Данная фаза наступает, только если производилась генерация ко- 
да и была выбрана генерация байт-кода. Рег] должен реконструировать из 
этой последовательности свои деревья грамматического разбора, прежде чем 
сможет выполнить программу. Ре! не выполняет байт-код непосредственно, 
это было бы слишком медленно. 


Фаза исполнения 


Наконец то, чего все ждали: прогон программы. Поэтому данная фаза также 
носит название фазы прогона (гип рћаѕе). Интерпретатор берет дерево грамма- 
тического разбора (полученное прямо от компилятора или косвенно через ге- 
нерацию кода и последующую реконструкцию дерева грамматического разбо- 
ра) и выполняет его. (Либо, если был создан исполняемый загрузочный мо- 
дуль, он может выполняться как самостоятельная программа, поскольку 
в него встроен интерпретатор Ре!1.) 


В начале этой фазы, перед запуском основной программы, все запланирован- 
ные блоки ПИТ выполняются в порядке следования в исходном коде. Затем вы- 
полняется основная программа. Интерпретатор может снова вызвать компи- 
лятор, встретив команду е\уа1 $ТА7М, йо РЕ, оператор гедиге, конструкцию 
5///ее или интерполируемое сопоставление с шаблоном, содержащее допусти- 
мое утверждение с кодом. 


По завершении основной программы будут выполнены отложенные блоки ЕМ, 
на этот раз в обратном порядке. Последним будет выполнен блок, встреченный 
первым, и на этом все закончится. Блоки ЕМ пропускаются только в случае 
вызова ехес или если выполнение процесса будет прервано критической ошиб- 
кой. Обычные исключительные ситуации не считаются критическими. 


Теперь обсудим эти фазы более подробно и в другом порядке. 


Компиляция кода 


Рег! всегда находится в одном из двух режимов работы: либо компилирует про- 
грамму, либо выполняет ее, и никогда в обоих состояниях одновременно. На про- 
тяжении этой книги мы часто говорим, что некоторые события происходят во 
время компиляции или что «компилятор Реп делает то-то и то-то». В других мес- 
тах мы отмечаем, что нечто происходит во время выполнения или «интерпрета 
тор Рег] делает то-то и то-то». Хотя можно считать компилятор и интерпретатор 
просто частями «Регі»; осознание того, какую из двух ролей Рен играет в каждый 


Исходный сценарий тоже является исполняемым файлом, но не на машинном языке, 
поэтому мы не называем его образом. Файл образе. носит такое название потому, что 
это дословная копия машинных кодов, которые выполняются непосредственно про- 
цессором. 
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конкретный момент, существенно для понимания причины возникновения тех 
или иных ситуаций. Исполняемый модуль ре] играет обе роли: сначала компи- 
лятора, а затем интерпретатора. (Есть и другие роли: регі является также опти- 
мизатором и генератором кода. Иногда даже проказником, но шутит только по- 
доброму.) 

Важно понимать различие между фазой компиляции (сотр!е рһаѕе) и временем 
компиляции (сотр! е іе), а также между фазой исполнения (гир рБазе) и време- 
нем выполнения (гип Яте). Типичная программа Ре! проходит одну фазу компи- 
ляции, а затем одну фазу исполнения. «Фаза» — это широкое понятие, но время 
компиляции и время выполнения - понятия конкретные. В фазе компиляции про- 
изводится в основном компилирование, но отчасти и выполнение - в блоках ВЕСТА. 
В фазе исполнения производится в основном выполнение, но могут осуществлять- 
ся и действия времени компиляции, если встречаются операторы типа е\а1 ТЕГА. 


В стандартной ситуации компилятор Рей сначала читает весь исходный текст 
программы, прежде чем начать выполнение. В это время производится синтакси- 
ческий анализ объявлений, команд и выражений, проверяется их синтаксиче- 
ская допустимость.! Найдя синтаксическую ошибку, компилятор пытается «не 
обращать на нее внимания», чтобы иметь возможность продолжить поиск оши- 
бок в исходном тексте. Это удается не всегда: синтаксические ошибки имеют 
свойство порождать целый каскад ложных сообщений об ошибках. Встретив по- 
рядка 10 ошибок, Рей в отчаянии опускает руки. 


В дополнение к интерпретатору, обрабатывающему блоки ВЕбІМ, программу, при 
потворстве трех придирчивых агентов, обрабатывает компилятор. Лексический 
анализатор (Іехег) высматривает в программе минимальные значимые единицы 
текста. В книгах, посвященных языкам программирования, их иногда называют 
лексемами (ехетез), или маркерами (іокепѕ). Лексический анализатор иногда на- 
зывается парсером, или сканером. Затем парсер (анализатор синтаксиса) пытаеч- 
ся найти смысл групп этих лексем, собирая из них более крупные конструкции, 
такие как выражения и инструкции, допустимые в грамматике языка. Оптими- 
затор (оріітігег) реорганизует эти более крупные образования и сокращает их 
в размерах, образуя более эффективные последовательности. Он тщательно выби- 
рает, какую оптимизацию применить, не отвлекаясь на мелочи, поскольку ком- 
пилятор Рег| в режиме «загрузи и выполни» должен работать молниеносно. 


Все это происходит не последовательно, а одновременно, при интенсивном обще- 
нии агентов между собой. Лексическому анализатору иногда требуются советы 
синтаксического анализатора, чтобы определить, который из нескольких допус- 
тимых типов имеет рассматриваемая им лексема. (Как ни странно, лексическая 
область видимости (Іехіса] ѕсоре) – одно из понятий, которые лексический анали- 
затор не понимает, поскольку «лексический» имеет в данном случае другой 
смысл.) Оптимизатор тоже должен следить за действиями синтаксического анали- 
затора, поскольку некоторые виды оптимизации нельзя применить, пока анализ 
не достигнет определенного момента, например не будет обнаружен конец выра- 
жения, инструкции, блока или подпрограммы. 


Формальных синтаксических диаграмм типа БНФ нет, но вы можете изучить файл 
регіу.у в каталоге с исходными текстами Регі, содержащий грамматику уасс(1), ис- 
пользуемую Регі. Советуем не трогать лексический анализатор, который известен тем, 
что вызывает нарушение аппетита у лабораторных крыс. 
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Может показаться странным, что компилятор Рег! осуществляет все эти дейст- 
вия одновременно, а не одно за другим, но ведь это тот же запутанный процесс, 
который происходит при восприятии естественного языка на слух или во время 
чтения. Не нужно дожидаться конца главы, чтобы сообразить, каков смысл пер- 
вого предложения. Такое соответствие представлено в табл. 16.1. 


Таблица 16.1. Соответствие терминов в компьютерном и естественном языках 


Компьютерный язык Естественный язык 


Символ Буква 
Лексема Морфема 
Терм Слово 
Выражение Фраза 
Инструкция Предложение 
Блок Абзац 

Файл Глава 


Программа Повесть 
Если синтаксический анализ проходит успешно, компилятор рассматривает ис- 
ходный код как допустимую повесть – э-э, программу. Если программа запущена 
с ключом -с, выводится сообщение «ѕупіах ОК» и осуществляется выход. В про- 
тивном случае компилятор передает плоды своих трудов другим агентам. Эти 
«плоды» имеют форму дерева грамматического разбора (рагзе ігее). Каждый 
«плод» на этом дереве, или узел (по4е), как его называют, представляет один из 
внутренних кодов операции (орсойеѕ) Реп, а ветви дерева представляют истори- 
ческую структуру его роста. В конце концов, узлы будут связаны между собой 
линейно, один за другим, чтобы обозначить порядок, в котором система этапа ис- 
полнения должна посетить эти узлы. 


Каждый код операции является наименьшей единицей представления выпол- 
няемых инструкций. Если вы считаете, что выражение $а = -($0 + $с) — это одна 
инструкция, то Рег! считает, что здесь шесть разных кодов операции. В упрощен- 
ном виде дерево грамматического разбора для этого выражения выглядит, как 
показано на рис. 16.2. Числа обозначают порядок, которому будет следовать сис- 
тема этапа выполнения. 


присваивание 


отрицание 


сложение 


Рис. 16.2. Порядок выполнения кодов операций для выражения $а = ($ + Фс) 
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Рей не является однопроходным компилятором, как могло показаться. (Однопро- 
ходные компиляторы сильно облегчают жизнь компьютеру, но осложняют ее 
программисту.) В действительности, это многопроходный оптимизирующий ком- 
пилятор, осуществляющий по крайней мере три логически различных прохода, 
чередующихся между собой. Проходы 1 и 2 осуществляются поочередно по мере 
перемещения компилятора вверх-вниз по дереву синтаксического разбора во вре- 
мя его построения; проход 3 выполняется, когда подпрограмма или файл полно- 
стью разобраны. Вот описание этих проходов: 


Проход 1: Восходящий синтаксический анализ 


Во время этого прохода синтаксический анализатор уасс(1) строит дерево син- 
таксического разбора, используя лексемы, полученные от лексического ана- 
лизатора (работу которого можно считать еще одним логическим проходом). 
«Восходящий» означает, что в поле зрения анализатора сначала попадают ли- 
стья дерева, а уже потом ветви и корень. Он действительно производит вычис- 
ления снизу вверх, как видно на рис. 16.2, где мы изобразили корень вверху, 
в манере, характерной для ученых в области информатики (и лингвистов). 


Для каждого создаваемого узла кода операции производится проверка правиль- 
ности семантики, например, количество и типы аргументов при вызове встро- 
енной функции. Но мере формирования частей дерева оптимизатор рассматри- 
вает возможность преобразования расположенных ниже поддеревьев. Напри- 
мер, узнав, что функции передается конкретное число аргументов, он может 
отбросить код операции, запоминающей число аргументов, переданных функ- 
ции с переменным числом аргументов. Более важный вид оптимизации, извест- 
ный как свертывание констант (сопѕіапі юата), описан далее в этом разделе. 


На этом проходе определяется порядок посещения узлов при последующем вы- 
полнении. Это ловкий фокус, поскольку верхний узел почти никогда не являет- 
ся первым в списке посещений. Компилятор создает временный цикл из кодов 
операций, при этом верхний узел указывает на первый код операции, который 
необходимо посетить. Когда код операции верхнего уровня включается в более 
крупную структуру, цикл кодов операций разрывается и образуется больший 
цикл с новым узлом на вершине. В конечном итоге цикл разрывается совсем, 
когда начальный код операции вставляется в некую другую структуру, напри- 
мер описатель подпрограммы. При вызове подпрограммы все же можно найти 
тот первый код операции, несмотря на то, что он находится глубоко в структу- 
ре дерева, как на рис. 16.2. Интерпретатору нет необходимости возвращаться 
вниз по дереву синтаксического разбора, чтобы определить начальную точку. 


Проход 2: Нисходящий оптимизатор 


Читая отрывок кода на Ре! | (как и отрывок любого фрагмента текста), нельзя 
определить его контекст, не изучив окружающие лексические элементы. Ино- 
гда невозможно разобраться в происходящем без дополнительной информа- 
ции. Не отчаивайтесь, однако, поскольку вы не одиноки: компилятору это то- 
же не удается. На этом проходе компилятор спускается вниз по только что по- 
строенному им поддереву, чтобы применить локальные оптимизации, самой 
примечательной из которых является распространение контекста (сопіехі 
ргораганоп). Компилятор устанавливает для узлов, располагающихся ниже, 
надлежащий контекст (пустой, скаляр, список, ссылка или левостороннее зна- 
чение), определяемый текущим узлом. Лишние коды операций обнуляются, 


538 Глава 16. Компиляция 


но не удаляются, поскольку менять порядок выполнения уже слишком позд- 
но. Мы предоставим третьему проходу возможность удалить их из временного 
порядка выполнения, определенного на первом проходе. 


Проход 3: Локальный оптимизатор 


Некоторые участки кода имеют собственное пространство памяти, в котором 
хранятся переменные с лексическим контекстом. (На жаргоне Ре!| такая об- 
ласть называется зсгафсйраа, или временной памятью.) В число этих участков 
входят инструкции е\уа] 57816, подпрограммы и целые файлы. С позиций оп- 
тимизатора более важно, что все они имеют собственную точку входа. Хотя 
это и означает, что порядок выполнения от этой точки известен, но мы не мо- 
жем знать, что происходило раньше, поскольку конструкция могла быть вы- 
звана из любого места. Поэтому, произведя синтаксический анализ такого 
участка, Ре! запускает для работы с ним локальный оптимизатор (реерБое 
орипитег). В отличие от предыдущих двух проходов, когда осуществлялось 
перемещение по дереву синтаксического разбора, в этом проходе код рассмат- 
ривается в линейном порядке, поскольку сейчас, в сущности, предоставляет- 
ся последняя возможность сделать это перед тем, как оторвать список кодов 
операций от синтаксического анализатора. Большинство оптимизаций при- 
меняется на первых двух проходах, но некоторые оптимизации на этих прохо- 
дах выполнить невозможно. 


Здесь применяются различные завершающие оптимизации, в том числе уста- 
навливается окончательный порядок выполнения путем пропуска обнулен- 
ных кодов операций, и определяются места, где те или иные сочетания кодов 
операций можно заменить чем-либо более простым. Важным видом оптимиза- 
ции является распознавание следующих друг за другом операций конкатена- 
ции строк, чтобы избежать копирования строки всякий раз, когда к концу ее 
что-то добавляется. Этот проход не только оптимизирует, но и производит мно- 
го «реальной» работы: отлавливает голые (Ъаге) слова, генерирует предупреж- 
дения по поводу сомнительных конструкций, ищет код, который, вероятно, 
никогда не получит управления, выполняет подстановку ключей псевдохешей 
и отыскивает подпрограммы, вызванные до компиляции прототипов 


Проход 4: Генерация кода 


Этот проход не является обязательным и обычно не используется. Но если вы- 
зван один из трех генераторов кода – В::Вуїесоде, В::С или В::СС, обход дерева 
синтаксического разбора выполняется еще раз. Генераторы кода создают либо 
последовательность байт-кодов Рей, используемую впоследствии для реконст- 
рукции дерева синтаксического разбора, либо код на С, отражающий состоя- 
ние дерева синтаксического разбора на этапе компиляции. 


Генерация кода на С может быть двух видов. В::С просто воссоздает дерево син- 
таксического разбора и запускает его с помощью обычного цикла гипорз, кото- 
рый сам Рен использует при выполнении. В::СС производит линеаризованный 
и оптимизированный С-эквивалент пути кода времени выполнения (напоми- 
нающий гигантскую таблицу переходов) и выполняет его. 


Во время компиляции Ре! применяет массу оптимизаций. Он перегруппировыва- 
ет код, чтобы сделать его выполнение более эффективным. Удаляет код, который 
никогда не будет выполнен, например блоки ії (0) или е1$1{ и е15е в блоке іѓ (1). 
Если используются лексические типизированные переменные, объявленные как 
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ту СЛаззМаме $уаг или оиг С1аѕѕМапе $уаг, и пакет С1аз$Мате был установлен с дирек- 
тивой и5е 11е19$, обращения к значениям констант из псевдохешей во время ком- 
пиляции проверяются на наличие опечаток и преобразуются в обращения к мас- 
сивам. Если вы задаете в операторе $0г{ достаточно простую процедуру сравне- 
ния, такую как {Фа <=> $0} или {$6 спр $а}, она заменяется вызовом скомпилиро- 
ванного С-кода. 


Наиболее впечатляющей из проводимых оптимизаций является ранняя подста- 
новка константных выражений. Рассмотрим, например, дерево синтаксического 
разбора, изображенное на рис. 16.2. Будь узлы 1 и 2 литералами или постоянны- 
ми функциями, узлы с 1 по 4 были бы заменены результатом вычисления этого 
выражения, как показано на рис. 16.3. 


присваивание 


Рис. 16.3. Свертывание констант 


Это называется свертыванием констант (сопяат [о ата). Свертывание кон- 
стант не ограничивается такими простыми случаями, как, например, замена во 
время компиляции выраженин 2**10 значением 1024. Оно включает также разре- 
шение вызовов функций ~ как встроенных, так и объявляемых пользователями, — 
удовлетворяющих критериям, описанным в разделе «Подставляемые функции- 
константы» главы 7. Ре! знает, какие из встроенных функций можно вызывать 
во время компиляции, что напоминает известную способность компиляторов 
ГОВТВАМ вызывать свои внутренние функции. Поэтому если попытаться проло- 
гарифмировать 0.0 или извлечь корень из отрицательного числа, будет получена 
ошибка компиляции, а не времени выполнения, и интерпретатор вообще не будет 
запущен.! Даже выражения с произвольной степенью сложности вычисляются на 
ранней стадии, что иногда влечет удаление целых блоков, как, например, ниже: 


ЇГ (2 * 5іп(1)/соѕ(1) < З && ѕоте?п()) { мпатемег() } 


Рег не генерирует код для выражений, которые никогда не будут вычисляться. 
Поскольку левая часть условного выражения всегда принимает ложное значе- 
ние, ни ѕотеїп, ни ира{еуег никогда не будут вызваны. (Поэтому не рассчитывайте, 
что вам удастся перейти на метки, находящиеся внутри блока: во время выполне- 
ния они просто не будут существовать.) Будь ѕопеѓп встраиваемой функцией-кон- 
стантой (п ПпаЫе сопѕёапћ), даже изменение порядка вычислений на такой: 


1 (ѕотеѓп() && 2 * $11(1)/соз(1) < 3)) { мћаїеуег() } 


не изменило бы результата, поскольку значение всего выражения по-прежнему 
можно определить во время компиляции. Будь мһаїтеуег встраиваемой, ее вызов 


1 Мы упростили изложение. Интерпретатор запущен будет, поскольку это необходимо 
для свертывания констант. Но произойдет это непосредственно на этапе компиляции, 
подобно тому, как выполняются блоки ВЕСІМ. 
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не производился бы ни во время выполнения, ни даже во время компиляции: ее 
значение было бы подставлено, как если бы функция являлась литеральной кон- 
стантой. Вы получили бы предупреждение о бесполезном применении константы 
в пустом контексте: «Оз@езз иѕе оѓ а сопѕіапііп уоіа сопѓехі». Оно может удивить, 
если не понять, что это константа. Однако будь ипатеуег последней инструкцией 
в функции, вызываемой в непустом контексте (согласно определению оптимиза- 
тора), предупреждения вы бы не увидели. 


Окончательный вид дерева синтаксического разбора после всех оптимизаций 
можно увидеть с помощью команды регі -Ох. (Ключ -Р требует специальной вер- 
сии Реп с поддержкой отладки). Читайте описание модуля В::0ерагѕе в разделе 
«Средства разработки кода». 


В общем, компилятор Ре! старается (но не слишком сильно) оптимизировать код, 
чтобы, когда придет время запускать программу, она выполнялась быстрее. Пора 
бы уже и запустить вашу программу, чем мы сейчас и займемся. 


Выполнение кода 


В первом приближении Ѕрагс-программы выполняются только на машинах 
Зрагс, Нце!-программы -— только на машинах Ітќеі, а Регі-программы - только на 
машинах Регі. Машина Рег! обладает свойствами, которые Регі-программа счи- 
тает идеальными для компьютера: автоматическое выделение и освобождение 
памяти, базовые типы данных в виде динамических строк, массивов и хешей без 
ограничений размера; а все системы ведут себя схожим образом. Задача интер- 
претатора Рей состоит в том, чтобы превратить компьютер, на котором он запу- 
щен, в одну из этих идеальных Регі-машин. 


Әта фиктивная машина представляет собой иллюзию компьютера, специально 
разработанного исключительно для выполнения программ на Рег. Каждый код 
операции, порожденный компилятором, является базовой командой в этом эму- 
лированном наборе инструкций. Вместо аппаратного счетчика команд за очеред- 
ностью выполнения кодов операций следит интерпретатор. Вместо указателя сте- 
ка интерпретатор имеет собственный виртуальный стек. Это очень важно, по- 
скольку виртуальная машина Реп (мы отказываемся называть ее РУМ)! является 
стековой. Коды операций Реп имеют внутреннее название РР со4ез («риѕћ-рор-ко- 
ды»), поскольку для поиска операндов, обработки временных значений и хране- 
ния результатов они используют виртуальный стек интерпретатора. 


Те, кому доводилось программировать на Еогіћ или РоѕіЅсгірё, либо работать 
с научным калькулятором НР с вводом в обратной польской (бесскобочной) нота- 
ции ВРМ (Веуегзе Ройзн №ъ№ќѓабоп), знают, как работает машина со стековой орга- 
низацией. Для тех, кто не знает, объясним. Идея проста: чтобы сложить З и 4, 
действия производятся в порядке 3 4 + вместо более привычного 3 + 4. На языке 
стека это означает, что сначала в стек проталкивается 3, затем 4, а потом + вытал- 
кивает со стека оба аргумента, складывает их и проталкивает 7 обратно в стек, 
где результат будет находиться, пока вы не сделаете с ним что-нибудь еще. 


' По-видимому, чтобы никто не думал, что речь идет о параллельной виртуальной ма- 


шине (тоже РУМ) или о Риеитоша Уігиѕ оё Місе. – Прим. ред.. 
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В сравнении с компилятором Рег интерпретатор Ре! является простой и почти 
скучной программой. Он всего лишь поочередно перебирает скомпилированные 
коды операций и отправляет их среде выполнения Регі, то есть виртуальной ма- 
шине Регі. Просто кусок кода на языке С. так? 


На самом деле, этот кусок кода – довольно интересный. Виртуальная машина 
Рей поддерживает значительный объем динамического контекста, чтобы это не 
приходилось делать вам. Рег] управляет множеством стеков, разбираться в кото- 
рых не обязательно, но мы все же перечислим их здесь, чтобы произвести на чи- 
тателя впечатление: 


стек операндов 
Об этом стеке мы уже говорили. 
стек сохранения 


Здесь сохраняются локализованные значения в ожидании восстановления. 
Многие внутренние процедуры локализуют значения незаметно для вас. 


стек области видимости 


Облегченный динамический контекст. опрелеляющий, когда должны вытал- 
киваться данные из стека сохранения. 


стек контекста 


Полновесный динамический контекст; последовательность вызовов, привед- 
шая туда, где вы сейчас находитесь. Обход этого стека выполняет функция 
са11ег. Функции управления циклами просматривают этот стек в поисках 
цикла, которым нужно управлять. При перемещении назад по стеку контек- 
ста происходит соответствующее перемещение по стеку видимости, в резуль- 
тате чего восстанавливаются локальные переменные со стека сохранения, да- 
же если выход из предыдущего контекста был выполнен каким-нибудь нехо- 
рошим способом вроде возбуждения исключительной ситуации и іопејтр(3). 


стек итрепо 


Стек контекстов /Іопеутр(З), позволяющий возбуждать исключительные си- 
туации и выходить ускоренно. 


стек возврата 

Точка, из которой был выполнен вход в текущую подпрограмму. 
стек маркеров (тагЕ ѕіаск) 

Место, где начинается текущий список аргументов на стеке операндов. 
стеки временной памяти лексических переменных для рекурсии 


Место хранения лексических переменных и других элементов «временного 
учета» при рекурсивном вызове подпрограмм. 


И конечно, имеется стек С, где хранятся все переменные С. Регі старается не пола- 
гаться на стек С при хранении запоминаемых величин, поскольку при іопејтр(8) 
не происходит правильного восстановления таких величин. 


Все это сказано к тому, что обычная точка зрения на интерпретатор – программу, 
интерпретирующую другую программу, – оказывается, к сожалению, неадекват- 
ной для описания происходящего. Да, есть некоторый С-код, реализующий неко- 
торые коды операций, но, произнося слово «интерпретатор», мы подразумеваем 
нечто большее – так же, как, произнося «музыкант», мы подразумеваем нечто 
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большее, чем набор инструкций ДНК для превращения нот в звуки. Музыкан- 
ты - реальные живые организмы со своим «состоянием». То же относится к ин- 
терпретаторам. 


Конкретно, весь этот динамический и лексический контекст, глобальные табли- 
цы символов, деревья синтаксического разбора плюс поток выполнения и есть то, 
что мы называем интерпретатором. Как контекст выполнения, интерпретатор на- 
чинает существовать еще раньше, чем компилятор, и может существовать в руди- 
ментарном виде даже в процессе создания компилятором контекста интерпрета- 
тора. На практике именно это и происходит, когда компилятор вызывает интер- 
претатор для выполнения блоков ВЕбІМ и подобных им. А интерпретатор может 
воспользоваться компилятором, чтобы достраивать себя. Всякий раз, когда опре- 
делятся новая подпрограмма или загружается новый модуль, виртуальная маши- 
на Ре], называемая интерпретатором, переопределяет себя заново. Невозможно 
точно сказать, которая из двух программ работает, компилятор или интерпрета- 
тор, потому что они взаимодейстьуют при управлении процессом самонастройки, 
который мы обычно называем «запуском сценария Регі». Это как самонастройка 
мозга ребенка. Кто ее осуществляет — ДНК или нейроны? Мы думаем – и ДНК, 
и нейроны, с некоторым участием привлеченных программистов. 


В одном процессе можно запустить несколько интерпретаторов. При этом они мо- 
гут совместно использовать деревья синтаксического разбора, если запускаются 
путем клонирования существующего интерпретатора. Можно также в одном ин: 
терпретаторе запускать несколько потоков, которые будут иметь общий доступ 
не только к деревьям синтаксического разбора, но и к глобальным символам. 


Однако большинство программ на Рег использует только один интерпретатор 
Ре! для выполнения скомпилированного кода. И хотя можно запустить несколь- 
ко независимых интерпретаторов Рег! в одном процессе, в настоящее время такая 
возможность доступна только из С. Каждый отдельный интерпретатор Рей игра- 
ет роль отдельного процесса, но создание его обходится дешевле, чем для совер- 
шенно нового процесса. Вот почему модуль расширения Арасћһе пой_рег1 достига- 
ет такой высокой производительности: при запуске сценария ССІ под пой рег1 
этот сценарий оказывается уже скомпилированным в коды операций Рег], поэто- 
му не требует перекомпиляции, но, что еще более важно, нет необходимости за- 
пускать новый процесс, а именно это и есть узкое место. Арасће инициализирует 
новый интерпретатор Рег! в существующем процессе и передает ему на выполне- 
ние ранее скомпилированный код. Конечно, как всегда, в действительности все 
сложнее. 


Интерпретаторы Рег можно встраивать во многие приложения, например: пі, 
ят и тпа, – перечислить их все просто невозможно. Некоторые коммерческие 
продукты даже не упоминают о том, что в них встроено ядро Рет|. Они просто ис- 
пользуют Рец, поскольку он позволяет им красиво решать свои задачи. 


Серверы компиляторов 


Что ж, если Арасһе может скомпилировать программу на Ре! и выполнить ее 
позже, почему вы не можете поступить так же? Арасһе и другие программы со 
встроенными интерпретаторами Регі живут просто: они не сохраняют дерево син- 
таксического разбора во внешнем файле. Если такой подход вас устраивает и вы 
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не возражаете против использования С АРІ с этой целью, то можете осуществить 
то же самое. 


Если вы не хотите идти таким путем или вам нужно что-то еще, есть несколько 
других вариантов. Вместо того чтобы передавать коды операций, созданные ком- 
пилятором, непосредственно интерпретатору Регі, можно использовать другие 
серверы (ФасКепдз). Они умеют сохранять скомпилированные коды операций во 
внешних файлах или даже преобразовывать их в С-код. 


Имейте в виду, что эти генераторы кода являются в значительной степени экспе- 
риментальными, и в промышленной среде полагаться на них не следует. На са- 
мом деле, полагаться на них не следует и в непромышленной среде, и работать 
они будут от случая к случаю. Теперь, когда мы настроили вас так, что любой ус- 
пех превзойдет всякие ваши ожидания. можно спокойно рассказать, как работа- 
ют эти серверы. 


Некоторые БасКепа-модули являются генераторами кода, например В::Вуїтесойе, 
В::С и В::СС. Другие, в сущности, являются средствами анализа и отладки, напри- 
мер В: :Верагзе, В: : 1111 и В::Хгеї. Помимо серверов (фасКепа3з) в стандартную версию 
входит ряд других низкоуровневых модулей, возможно, представляющих инте- 
рес для будущих авторов средств разработки программ на Рег]. Другие баскепа- 
модули можно найти в СРАМ, в том числе (на момент написания данной книги) 
В::Ратпом, В::бгарћ и В::$17е. 

Когда компилятор Рей используется не на входе интерпретатора, а в других це- 
лях, между ним и различными Баскеп-модулями размещается модуль 0 (с помо- 
щью файла О.рт). Васкепа-модуль не вызывается напрямую, вместо него вызы- 
вается промежуточное звено, которое, в свою очередь, вызывает указанный сер- 
вер (ЪасКепа). Если имеется, скажем, модуль В: :Васкепа, то вызвать его с нужным 
сценарием можно так: 


% рег1 -М0=Васкепд ЗСАТРТМАМЕ 
Некоторые ЪасКепд-модули принимают параметры, которые указываются так: 


Х рег1 -МО=Васкепд, ОРТ$ ЅСАІРТМАМЕ 


У некоторых серверов (Баскепдѕ) уже есть интерфейсы, позволяющие вызывать 
промежуточное звено, так что вам нет необходимости запоминать их М.О. В част- 
ности, регісс(1) вызывает этот генератор кода, который может оказаться довольно 
неудобным для ручного запуска. 


Генераторы кода 


Со всей определенностью следует подчеркнуть, что все три сервера (баскепаѕ) 
преобразования кодов операций Рен в некоторый другой формат являются экспе- 
риментальными. (Мы уже говорили об этом, но считаем необходимым напомнить 
еще раз.) Даже когда им случается сгенерировать код, который выполняется пра- 
вильно, получившиеся программы могут потребовать больше дискового про- 
странства, памяти и ресурсов СРО, чем в обычном случае. Исследования и разра- 
ботка все еще продолжаются в этой области. Со временем положение будет улуч- 
птаться. 
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Генератор Вуесоде 


Модуль В::Вуїесойе выводит коды операций дерева синтаксического ризбора в неза- 
висимой от платформы кодировке. Сценарий на Рей, скомпилированный в байт- 
коды. можно перенести на любую машину, где установлен Рет|. 


Стандартная, но пока экспериментальная команда ретсс(1) позволяет преобразо- 
вать исходный код на Ре! в скомпилированную в байт-коды программу Рег]. 
Нужно лишь выполнить команду: 


Х рег1сс -Б -о рбуѕсгірї ѕгсѕсгірї 


Полученный сценарий рђузѕсгірі можно выполнить непосредственно. Начало это- 
го файла выглядит примерно так: 


#1 /иѕг/біп/рег1 

иузе Вутегоадег 0.03; 

7С767ЕА?С76”6 6 гАЕ°@”С^ее”еВ?Ее”с”е”е”е”с”ғ”е”с”е”ее 
8^@`@^@^Н9^АВМ-^7М-^7М-^?М-7?7М-7?М-7?М-7?М-^76^@`@`@`Аб”@ 
76^07°07е”е”е”кя”е”е”е”н57е”е”е”Ну”ем- 2и<ғи”е”е”е”ех”үег^е 


Здесь виден небольшой заголовок сценария, за которым следуют двоичные дан- 
ные. Это может выглядеть тайной магией, но в действительности, если магия 
здесь и есть, ее очень мало. Модуль Вуїеіоайег использует технологию входного 
фильтра (ѕоигсе НЦет), чтобы преобразовать исходный текст, перед тем как пере- 
дать его Регі. Входной фильтр – своего рода препроцессор, применяемый к содер- 
жимому текущего файла. Он выполняет не только простые преобразования, осу- 
ществляемые, например, макропроцессорами срр(1) и т4(1): никаких ограниче- 
ний не накладывается. Существуют входные фильтры для расширения синтак- 
сиса Регі, сжатия и шифрования исходного кода и даже записи программ Рег] на 
латыни. Е регіібиѕ ипісоде; сой{о, его ѕирѕіг; сагр Ча, еф а]. Э-э, спуеаё зсгірёог — 
пусть автор сценирия будет бдителен. 


Модуль Вуїеі оадег – это входной фильтр, способный дизассемблировать переве- 
денные в последовательную форму коды операций, произведенные В::Вутесоде, 
и восстанавливать исходное дерево синтаксического разбора. Воссозданный код 
Рег! образует текущее дерево синтаксического разбора без помощи компилятора. 
Когда интерпретатор находит эти коды операций, он просто выполняет их, как 
если бы они только того и ждали. 


Генераторы кода на С 


Оставшиеся генераторы кода, В::С и В::СС, создают не преобразованные в последо- 
вательную форму коды операций Рег], а код на языке С. Генерируемый ими код 
не отличается хорошей читаемостью, и вы ослепнете, если попытаетесь в нем ра- 
зобраться. Использовать их, чтобы вставлять в большую программу на С малень- 
кие фрагменты, оттранслированные из Регі в С, не удастся. 


Модуль В: :С просто выводит структуры данных на С, необходимые для воссоздания 
среды выполнения Рей целиком. В результате получается специализированный 
интерпретатор со всеми инициализированными структурами данных, построен- 
ными компилятором. В некоторых отношениях получаемый код похож на то, что 
создает В::Вуїіесоде. Оба модуля выполняют простое транслирование деревьев кодоЕ 
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операций, создаваемых компилятором, но если в: :Вутесоде делает это в символи- 
ческой форме, чтобы позже воссоздать и передать работающему интерпретатору 
Рен, то В::С записывает эти коды операций на С. Если скомпилировать этот код 
компилятором С и скомпоновать с библиотекой Ре, получившаяся программа 
будет выполняться без участия интерпретатора Ре. (Могут, однако, потребо- 
ваться некоторые общие библиотеки, если компоновка не была полностью стати- 
ческой.) Эта программа, в сущности, не будет отличаться от обычного интерпре 
татора Рег, выполняющего сценарий. Она просто будет скомпилирована как са- 
мостоятельный выполняемый модуль. 


Модуль В::СС пытается пойти значительно дальше. Начало генерируемого им фай- 
ла весьма похоже на то, что создает В::С, но на этом ьсякое сходство заканчивает- 
ся. В коде, создаваемом В: :С, имеется большая таблица кодов операций на С, кото- 
рая обрабатывается, как это делал бы сам интерпретатор, в то время как С-код, 
генерируемый В::СС, записывается в порядке, соответствующем логике выполне- 
ния вашей программы. В нем есть даже С-функции, соответствующие всем функ- 
циям вашей программы. Производится некоторая оптимизация по типам пере- 
менных. Некоторые контрольные тесты выполняются вдвое быстрее, чем при 
обычной интерпретации. Это наиболее претенциозный из имеющихся в настоя- 
щее время генераторов кода и самый многообещающий. Не случайно, что он наи- 
менее устойчив в работе. 


Студенты, изучающие информатику и не выбравшие еще тему дипломного про- 
екта, могут не искать ничего иного. Здесь масса необработанных алмазов, жду- 
щих огранки. 
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У модуля 0 есть много интересных возможностей помимо предоставления данных 
для невыносимо недоработанных генераторов кода. Предоставляя относительно 
легкий доступ к результатам работы компилятора Рей, этот модуль облегчает 
создание других инструментов, которым нужно знать все о программе на Рег]. 


Модуль В::1іпї получил свое название от ПпК1), верификатора программ С. Он 
ищет в программах сомнительные конструкции, о которые часто спотыкаются 
новички, но которые обычно не влекут вывод предупреждений. Модуль вызыва- 
ется непосредственно: 


% рег1 -МО=1 іп, а11 тургод 


В настоящее время осуществляется всего несколько видов проверок, например ис- 
пользование массивов в неявных скалярных контекстах, использование перемен- 
ных по умолчанию и обращение к (номинально закрытым) начинающимся симво- 
лом _ идентификаторам в других пакетах. Подробности читайте на страницах 
Вии). Вы наверняка встретитесь со многими программистами, проверяющи- 
ми свои программы с помощью Рег1::Сгіїіс. Это инструмент статического анали- 
за, созданный на основе РРІ и прекрасно справляющийся со своей работой. 


1 Как и все прочее, если вы потеряли зрение. Но мы жє предупреждали, чтобы вы не 


подглядывали! 
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Модуль В: :ХгеГ генерирует списки перекрестных ссылок для объявлений и ис- 
пользования всех переменных (как с глобальной, так и с лексической областями 
видимости), подпрограмм и форматов с разбивкой по файлам и подпрограммам. 
Модуль вызывается так: 


Х рег1 -М0=Хге? мургод > пургод. рхге? 
Вот пример фрагмента созданного отчета: 


Ѕиргоџтіпе рагѕе_агом 
Раскаде (1Іехіса1) 


Фоп 1113, 114 
$орї 1113, 114 
Ф%деторї_с?о 1107, 113 
@сѓд_агоѕ 1112, 114, 116, 116 
Раскаде беторї: :Іопо 
$+9погесазе 101 
&0еї0р+тіопѕ 85124 
Раскаде та1п 
$0ртіопѕ 123, 124 141, 150, 165, 169 
%$0ргіопѕ 141, 150, 165, 169 
&спеск_геад &167 
@АВСУ 121, 157, 157, 162, 166, 166 


Здесь видно, что в подпрограмме рагзе_агоу – четыре собстьенных лексических 
переменных; кроме того, она обращается к глобальным идентификаторам из па- 
кетов паіп и беторт::{1опд. Числа — это номера строк, где используется объект: пре- 
фикс 1 означает, что первое появление объекта имело место в строке с номером, 
который за ним следует, а префикс & указывает на вызов подпрограммы в соот- 
ветствующей строке. Операции разыменовывания перечисляются отдельно и по- 
тому здесь показаны как $0рїіоп, так и %$0рїіопѕ. 


Модуль В: :Берагзе позволяет снять пелену таинственности с кода Рей и понять, 
какие преобразования произвел над кодом оптимизатор. Ниже показано, напри- 
мер, какие значения по умолчанию использует Рег! для различных конструкций: 
Х рег1 -МО=берагзе -пе "ог (1 .. 10) { ргіпї 1 -+ }° 
ИМЕ: ме (деғ1пед(%_ = <АВОМ)) { 
Ғогеасһ $_ (1 . 10) { 
ргіпі $_ 17 тї 5ТрІМ, 
} 
} 


Ключ -р расставляет скобки, что позволяет видеть, какие приоритеты операторов 
использует Рей: 


Х рег1 -МО=Оерагзе, -р -е "ргіпі $а •• 3 + =дгі(2) / 10 =* -2 «• $с 
ргіпі((($а ** 3) + (1.4142135623731 / (10 ** (-(2 ** $с)))))); 


С помощью ключа -4 можно увидеть, в какие примитивы компилируются интер- 
полируемые строки; 


Х рег1 -М0=рерагѕе, -д -е `”А $пате апо зоте @АВСУ\п" ' 
"А . Фпапе апд зоте 301п($” @АВбУ) “\п”; 


А ниже показано, как Рей в действительности компилирует трехчастный цикл 
Тог в цикл ий Пе: 
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Х рег1 -МО=берагзе -е "тог ($1=0; $1<10; $1++) { $ж++ }° 
$1 = 0; 
мћі1е ($1 < 10) { 
++$х: 
} 
сопї1пие { 
++$1 


} 


Можно даже применить В: ;Оерагзе к файлу байт-кодов Рей, сгенерированному ко- 
мандой регісс -Б, и заставить его декомпилировать исполняемый модуль. Переве- 
денные в последовательную форму коды операций Рен читать, может быть, труд- 
новато, но вполне возможно. 


Компилятор и интерпретатор: 
авангардизм и ретро 


Думать обо всем следует в должное время: иногда заблаговременно, иногда — впо- 
следствии. А бывает, что где-то между этими крайностями. Ре! не притворяется, 
что знает, когда наступает подходящий момент для размышлений, поэтому пре- 
доставляет программисту ряд возможностей известить себя об этом. Иногда Регі 
понимает, что нужно немного подумать, но не знает, о чем именно, поэтому у него 
должен быть способ спросить об этом вашу программу, которая ответит на такие 
вопросы путем определения подпрограмм с именами, соответствующими тому, 
что Ре пытается выяснить. 


Не только компилятор может вызвать интерпретатор, когда захочет быть преду- 
смотрительным, но и интерпретатор может снова вызвать компилятор, когда ему 
нужно пересмотреть историю. Есть несколько операторов, которые можно ис- 
пользовать для обратного вызова компилятора. Как и компилятор, интерпрета- 
тор может вызывать подпрограммы по именам, когда ему нужно выяснить поло- 
жение вещей. Весь этот обмен, происходящий между компилятором, интерпрета- 
тором и программой, требует, чтобы вы знали, когда и какие события происхо- 
дят. Сначала мы обсудим вопрос о том, когда запускаются эти именованные 
подпрограммы. 


В главе 10 мы видели, как запускается процедура АПТО!.0АБ при обращении к функ- 
ции, которая не определена в этом пакете. В главе 12 мы познакомились с мето- 
дом ОЕЗТНОУ, вызываемым, когда Ре! намеревается автоматически освободить па- 
мять, занимаемую объектом. И в главе 14 мы столкнулись со многими функция- 
ми, неявно вызываемыми при обращении к связанной переменной. 


Все эти подпрограммы используют соглашение о том, что имена подпрограмм, 
автоматически запускаемых компилятором или интерпретатором, состоят из за- 
главных букв. С различными этапами жизненного цикла программы связаны 
еще пять таких подпрограмм: ВЕСІМ№, ОМІТСНЕСК, СНЕСК, ІМІТ и Е\О. Ключевое слово 
ѕир перед их объявлениями не обязательно. Возможно, правильнее было бы назы- 
вать их «блоками», поскольку они ведут себя скорее как именованные блоки, а не 
как настоящие подпрограммы. 


Например, в отличие от обычных подпрограмм, эти блоки допускается объяв- 
лять многократно, и вам не нужно вызывать их по имени, потому что Рег. следит 
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за тем, когда их вызывать. (Отличие от обычных подпрограмм состоит также 
в том, что 5ћіѓЇ и рор действуют, как если бы вы находились в главной программе, 
то есть по умолчанию воздействуют на @АНСУ, а не на@_.) 


Эти пять блоков выполняются в следующем порядке: 
ВЕСІМ 


Запускается АЗАР (аз зооп аз рагзей — сразу после синтаксического разбора), 
как только встретится во время компиляции и перед компиляцией осхавшей- 
ся части файла. 


ОМІТСНЕСК 


Запускается сразу после компиляции единицы компиляции, в которой опре- 
делен. Главный файл программы и все модули, которые он загружает, явля- 
ются единицами компиляции. Сюда же относятся строки е\а1, блоки кода 
в конструкциях (?{ })и (??{ }) внутри регулярных выражений, вызовы йо ҒПЕ 
и гедиіге ЕПЕ, и программный код, следующий за ключом -е в командной 
строке. УМТТСНЕСК — это не ІМІТ, который используется для определениях про- 
граммного кода, выполняющего инициализацию. 


СНЕСК 


Запускается по завершении компиляции, но перед запуском программы. 

(СНЕСК может означать «контрольную точку», «двойную проверку» или даже 

«останов».) 
ІМІТ 

Запускается в начале выполнения перед началом основной логики программы. 
ЕМО 

Запускается в конце выполнения сразу после завершения программы. 
Если имеется несколько таких подпрограмм с одинаковыми именами, даже 
в разных модулях, то все ВЕСІМ выполняются перед всеми СНЕСК, которые все вы- 
полняются раньше всех ІМТ, которые выполняются раньше всех ЕМ№, которые вы- 
полняются в самую последнюю очередь послє завершения основной программы. 
Если блоков ВЕСІМ и ІМІТ несколько, они выполняются в порядке объявления 
(ЕТРО), а СНЕСК и ЕМ№ выполняются в порядке, обратном объявлению (РО). 


Проще всего, вероятно, показать это на следующем примере: 


иѕе м5. 10; 

ѕау “начало выполнения таіп” 

діе “завершение таіп\п' 

діе “ХХХ: не достигнут\п ; 

ОМІТСНЕСК { зау “1-й УМТТСНЕСК: конец компиляции” } 
ЕМО { ѕау "1-й ЕМО. конец выполнения” } 
СНЕСК { зау "1-й СНЕСК: конец компиляции” } 
ІМІТ { зау "1-й ІМІТ: начало выполнения” } 
ЕМ { зау "2-й ЕМО: конец выполнения” } 
ВЕСІМ { зау "1-й ВЕСІМ: продолжение компиляции” } 
ІМТ { ѕау “2-й ІМІТ: начало выполнения” } 
ВЕСІМ { зау "2-й ВЕСІМ: продолжение компиляции” } 
СНЕСК { ѕау "2-й СНЕСК конец компиляции” } 
ЕМО { ѕау “3-й ЕМО: конец выполнения” } 
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Эта демонстрационная программа выведет следующее: 


1-й ВЕСІМ№: продолжение компиляции 
2-й ВЕСТ№: продолжение компиляции 
1-й ОМІТСНЕСК: конец компиляции 
2-й СНЕСК конец компиляции 

1-й СНЕСК: конец компиляции 

1-й ІМІТ: начало выполнения 

2-й ІМІТ: начало выполнения 
начало выполнения таіп 

завершение таіп 

3-й ЕМО конец выполнения 

2-й ЕМО: конец выполнения 

1-й ЕМ№: конец выполнения 


Поскольку блок ВЕСТМ выполняется немедленно, он может объявлять, определять 
и импортировать подпрограммы еще до того, как будет скомпилирована осталь- 
ная часть файла. В результате может измениться то, как компилятор осуществ- 
ляет синтаксический анализ оставшейся части файла, особенно если импортиру- 
ются определения подпрограмм. Как минимум, объявление подпрограммы по- 
зволяет использовать ее в качестве списочного оператора, делая необязательным 
применение скобок. Если импортированная подпрограмма объявлена с прототи- 
пом, обращения к ней могут интерпретироваться как вызовы встроенной подпро- 
граммы и даже переопределять встроенные подпрограммы с тем же именем, со- 
общая им новую семантику. К объявлению изе можно относиться просто как 
к блоку ВЕСТЬ. 


Напротив, блоки Е\№О выполняются как можно позже: когда программа покидает 
интерпретатор Рей, даже в результате неперехваченного 41е или другой фаталь- 
ной исключительной ситуации. Есть два случая, в которых блок Е\№ (или метод 
ОЕЗТВОУ) пропускается. Он не выполняется, если текущий процесс вместо выхода 
переходит из одной программы в другую посредством ехес. Процесс, «выброшен- 
ный на берег» из-за неперехваченного сигнала, тоже пропускает свои процедуры 
ЕЮ. (См. описание директивы $19тгар в главе 29, где рассматривается преобразо- 
вание перехваченных сигналов в исключительные ситуации. Общая информа- 
ция по обработке сигналов дана в разделе «Сигналы» главы 15.) Предотвратить 
выполнение всех ЕМ можно, вызвав Р051Х:: ехії, выполнив команду Е Ш -9 $$ 
или просто запустив через ехес какую-нибудь безобидную программу вроде /біп/ 
гие в системах ОМІХ, 


Внутри блока Е№ переменная $? содержит код состояния, с которым программа 
собирается выйти. Значение $? можно изменить внутри блока Е№0, чтобы про- 
грамма завершилась с другим кодом состояния. Не измените случайно $7, запус- 
тив другую программу через ѕуѕїеп или обратные апострофы. 


Если в файле имеется несколько блоков Е№, они выполняются в порядке, обрат- 
ном порядку их определений. То есть блок Е№0, объявленный последним, будет 
выполнен первым по завершении программы. Это позволяет организовать пра- 
вильное вложение попарно связанных друг с другом блоков ВЕбТМ и ЕМ№. Напри- 
мер, если основная программа и загружаемый ею модуль имеют свои парные под- 
программы ВЕСТМ и ЕЮ, как показано ниже: 


1 Имеется в виду, вызвав функцию ѕуѕїет("кі11 -9 $$") из программы. — Прим. перев. 
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ВЕСІМ { ргіпі “тазп бедил” } 
ЕМО { ри1пЕ "таіп епдед” } 
иѕе Моди1е; 


и такие объявления в модуле: 


ВЕСТМ { рглпф “тодџ1е Бедип” } 
ЕМО { ргіпї “поди1е епдед” } 


то основная программа знает, что ее ВЕбІМ всегда выполнится первым, а ее ЕМ№ — 
последним. (Да, ВЕСІМ является, в сущности, блоком этапа компиляции, но анало- 
гичные принципы применимы к парным блокам ТТ и Е№ на этапе выполнения.) 
Этот принцип рекурсивно выполняется для любого файла, содержащего другой, 
если в обоих есть такие объявления. Данное свойство вложенности позволяет ис- 
пользовать блоки как конструкторы и деструкторы пакетов. В каждом модуле 
могут быть свои функции установки и демонтажа, которые Регі вызовет автома 

тически. Благодаря этому программисту, применяя конкретные библиотеки, не 
нужно помнить, какой код инициализации или уборки мусора должен вызы- 
ваться и когда. Объявления в модуле обеспечивают эти события. 


Если рассматривать е\уа] 5ТАТ как обратный вызов интерпретатором компил»- 
тора, то ВЕСІМ можно рассматривать как прямой вызов компилятором интерпрета- 
тора. В обоих случаях текущая деятельность приостанавливается, и переключа- 
ется режим работы. Когда мы говорим, что блок ВЕСТМ выполняется как можно 
раньше, мы имеем в виду, что он выполняется, как только будет полностью опре- 
делен, даже раньше, чем будет проанализирована оставшаяся часть файла. По- 
этому блоки ВЕСІМ всегда выполняются на этапе компиляции, а не выполнения. 
После выполнения блока ВЕСІМ он сразу становится неопределенным, а использо- 
вавшийся в нем код возвращается в пул памяти Рег]. При всем желании вызвать 
блок ВЕСІМ как подпрограмму не удастся, потому что к тому времени, когда вы 
сможете это сделать, его уже не будет в живых. 


Аналогично блокам ВЕСТК, блоки ІМІТ запускаются перед началом этапа выполне- 
ния Рег в порядке «первым пришел, первым ушел» (ЕТРО). Например, генерато- 
ры кода, описанные в странице руководства регісс, используют блоки ТТ для 
инициализации и разрешения указателей на ХЗОВ. Блоки ІМІ очень похожи на 
блоки ВЕСТА, но позволяют программисту отделить конструктор, выполняемый на 
этапе компиляции, от конструктора, выполняемого на этапе выполнения. При 
непосредственном запуске сценария это не очень важно, поскольку в любом слу- 
чае каждый раз вызывается компилятор. Но если компиляция отделена от вы- 
полнения, это различие может быть критическим. Компилятор может быть вы- 
зван один раз, а полученный выполняемый модуль может вызываться много- 
кратно. 


Аналогично блокам Е№, блоки СНЕСК запускаются сразу по окончании этапа ком- 
пиляции Рен, но до начала этапа выполнения, в порядке, обратном их следова- 
нию (ТРО). Блоки СНЕСК могут пригодиться, чтобы «свернуть» компилятор, по- 
добно тому, как блоки ЕМ№ удобно применять, чтобы «свернуть» программу. В ча- 
стности, серверы используют блоки СНЕСК как перехватчики для запуска своих 
генераторов кода. Все, что им нужно сделать — это вставить блок СНЕСК в собствен- 
ный модуль, и он будет запущен в нужный момент, а вам не потребуется встав- 
лять СНЕСК в свою программу. Поэтому программисту редко требуется самому пи- 
сать блок СНЕСК, если только он не создает свой модуль такогс типа. 
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Объединяя все сказанное, табл. 16.2 перечисляет различные конструкции с под- 
робностями о том, когда они компилируются и когда выполняют код, обозначен- 
ный « ». 


Таблица 16.2. Что когда происходит! 


Блок или Компилиру- | Перехватывает | Выпол- | Перехватывает | Политика за- 
выражение |ется в фазе | ошибки няется | ошибки пуска 
компиляции выполнения вызова 

иѕе ... С С Сейчас 

по С С Сейчас 

ВЕСТМ {...} С С Сейчас 

ОМІТСНЕСК {...} [С С Поздний 

СНЕСК {...} С С Поздний 

ІМІТ {...} С В Ранний 

ЕМО {...} С К Поздний 

е\ма1 {...} С В Встроенный 

е\а1 “ В К Встроенный 

Гоо(...) С В Встроенный 

зи6 Ғоо {...} С В Вызов в любое 
время 

ема1 "ѕиб {...}" К Поздний 
вызов 

ѕ/раї/.../е К Встроенный 

ѕ/раї/"..."/ее Встроенный 


Теперь, уяснив партитуру, вы сможете сочинять и исполнять свои пьесы для Рег] 
с большей уверенностью. 


' Символом «С» в таблице обозначается фаза компиляции (Сошрие), а символом Б – фаза 


выполнения (Вип те). — Прим. перев. 


Интерфейс командной строки 


Эта глава посвящена тому, как наводить орудие Ре! перед выстрелом. Есть не- 
сколько способов наводки Ре. Два основных — ключи командной строки и пере- 
менные среды. Ключи обеспечивают более сподручный и точный способ нацели- 
вания конкретной команды. Переменные среды чаще используются для настрой- 
ки общей политики. 


Обработка команд 


Большая удача, что Ре эволюционировал в мире ОМІХ, поскольку, благодаря 
этому, синтаксис его вызова работает достаточно хорошо в интерпретаторах ко- 
манд и других операционных систем. Большинство интерпретаторов команд в со- 
стоянии интерпретировать список слов как аргументы и не смущается, если пер- 
вый символ аргумента начинается символом «—». Есть, правда, неприятные мо- 
менты, в которых можно запутаться при переходе от одной системы к другой. 
Например, в М5-0ОБ нельзя использовать одиночные кавычки, как это делается 
в ОМХ. А втаких системах, как УМФ, некоторым программам-оберткам придет- 
ся нелегко при эмулировании переадресации ввода/выводё ОМХ. Интерпрета- 
ция масок — вообще дело непредсказуемое. Однако после того, как вы разберетесь 
с этими тонкостями, Ре! станет работать с ключами и аргументами сходным об- 
разом в любой операционной системе. 


Даже если у вас отсутствует собственно интерпретатор команд, программы на 
Рей легко можно запускать из любых других программ, написанных на любом 
языке. Вызывающая программа может передавать аргументы не только обыч- 
ным способом, но и через переменные среды и, если позволяет операционная сис- 
тема, через унаследованные дескрипторы файлов (см. раздел «Передача дескрип- 
торов файлов» главы 15). Даже самые экзотические механизмы передачи аргу- 
ментов легко можно реализовать в отдельном модуле, подключив его к програм- 
ме Рег| с помощью обычной директивы ие. 


Рег! анализирует аргументы командной строки стандартным образом. Это зна- 
чит, что он рассчитывает получить ключи (слова, начинающиеся со знака «--») 
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в начале командной строки. Затем обычно следует название файла сценария, а за 
ним – дополнительные аргументы, которые ему нужно передать. Некоторые из 
этих дополнительных аргументов сами могут выглядеть как ключи, но их дол- 
жен обрабатывать сценарий, поскольку Ре прекращает разбор ключей, встре- 
тив аргумент, не являющийся ключом, или специальный ключ «--», означаю- 
щий, что этот ключ – последний. 


Реп дает некоторую свободу в размещении исходного кода программы. Если речь 
о маленькой одноразовой задаче, программу на Ре можно целиком уместить 
в командной строке. Более объемные и «долгоживущие» задачи можно оформ- 
лять как сценарии Ре! в отдельных файлах. Сценарий для компиляции и запус- 
ка Регі может быть указан одним из следующих трех способов: 


1. Построчно в командной строке с помощью ключей -е или -Е, например: 


Х рег1 -е "ргіпі "Не110, Могла. `" 
Не110, Мог1а. 


Х регі -Е "ѕау 'Номду у\\`а11`" 
Номду у’а11! 


2. По имени файла, содержащего сценарий: в качестве такового используется 
первый файл, обозначенный в командной строке. Системы, поддерживающие 
обозначение #! в первой строке файла с выполняемым сценарием, вызывают 
интерпретатор, указанный за данным обозначением. 


8. Неявно, через стандартный ввод. Этот метод срабатывает только при отсутст- 
вии имен файлов среди аргументов; чтобы передать аргументы сценарию, при- 
нятому из стандартного ввода, нужно использовать метод 2, явно указав в ка- 
честве имени сценария «-». Например: 


Х есһо "ргіпЕ 99(Не110, @АВбУ. )" | рег1 - №г19 
Не110, №ог10. 


При использовании методов 2 и З Ре! начинает синтаксический анализ входного 
файла с самого начала, но если задан ключ -х, тогда он ищет первую строку, на- 
чинающуюся с #! и содержащую слово «регі», и начинает анализ с этого места. 
Это полезно при запуске сценария, встроенного в текст длинного сообщения. Обо- 
значить конец сценария в этом случае можно с помощью маркера __ЕМ0__. 


Используете вы ключ -х или нет, но при синтаксическом анализе в строке #! все- 
гда выполняется поиск ключей. Благодаря этому при работе на платформе, под- 
держивающей только один аргумент в строке #! или, того хуже, даже не воспри- 
нимающей строку #! как особую, можно иметь единообразное восприятие клю- 
чей независимо от того, как был вызван Регі, даже если для поиска начала сцена- 
рия был указан ключ -х. 


Предупреждение: поскольку в ранних версиях ОМХ ядро молча заканчивает ин- 
терпретацию строки #! после 32 символов, некоторые ключи программа может по- 
лучить в целости, а другие - нет; можно даже получить «-» без последующей бук- 
вы, если не проявить осторожность. Возможно, потребуется сделать так, чтобы 
все ключи находились по одну сторону (до или после) этой границы в 32 символа. 
Для большинства ключей неважно, если они обработаются лишний раз, но полу- 
чение «-» вместо целого ключа приведет к тому, что Ре! будет пытаться прочесть 
исходный код со стандартного ввода, а не из вашего сценария. Неполный ключ -Ї 
тоже может привести к неожиданным результатам. Однако некоторые ключи не 
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безразличны к повторной обработке, например комбинации -[ и -0. Либо помес- 
тите все ключи за 82-символьной границей (если это возможно), либо вместо 
-0рІ6ІТ5 используйте ВЕСІМ $/ = “\00ТСТТС”; }. Конечно, если вы работаете не под 
ОМІХ, то с такой проблемой вы не столкнетесь. 


Синтаксический разбор ключей в строке #! начинается с места, где впервые встре- 
тится слово «регі». Последовательности «-*• и « › специально игнорируются 
в интересах пользователей етасѕ, поэтому при желании можно записать: 


#1 /біп/ѕћ -- # -*- рег1 --*- -р 
ема1 ‘ехес рег1 -5 $0 ${1+"$0@"}' 
ЇЁ 0; 


и Рег] распознает только ключ -р. Причудливое сочетание «-»- рег1 -*-» сообщает 
етасѕ о необходимости начать работу в режиме Регі; если вы не пользуетесь 
етасз, оно вам не потребуется. Путаница с ключом -5 разъясняется ниже, в опи- 
сании этого ключа. 


Аналогичный трюк связан с программой епі1), если она у вас есть: 
#1 /оѕг/ріп/епу рег1 


В предыдущих примерах используется относительный путь к интерпретатору 
Рег|, находящий ту его версию, которая первой встретится в маршруте поиска 
пользователя. Если требуется особая версия Регі, например регі5.14.0, поместите 
ее прямо в путь строки #!, независимо от того, используете ли вы программу ель, 
ключ -$ или обычную обработку #!. 


Если строка #! не содержит слова «регі», вместо интерпретатора Рей] будет выпол- 
нена прогримма, указанная после #!. Предположим, что у вас есть обычный сце- 
нарий интерпретатора команд Борна с таким текстом: 


#1 /о1п/ѕћ 
есһо "І ат а $1е11 зсгарт” 


Если подать этот файл на вход Реп, он запустит /біп/ѕћ. Это несколько странно, 
но полезно на машинах, которые не распознают #', поскольку путем установки 
переменной среды 5НЕ можно сообщить программе (например, почтовой), что 
интерпретатором команд служит /изг/Ыт/рей, и Рег! отправит программу нуж- 
ному интерпретатору, даже если ядро не сможет этого сделать само. 


Но вернемся к сценариям Регі, действительно являющимся сценариями Рег]. 
Отыскав сценарий, РегІ скомпилирует всю программу во внутреннее представле- 
ние (см. главу 16). Если возникнут ошибки компиляции, выполнение не начнет- 
ся. (В то время как обычные сценарии интерпретатора команд и командные фай- 
лы могут частично выполниться, прежде чем будет обнаружена синтаксическая 
ошибка.) Если сценарий синтаксически корректен, он выполняется. Если сцена- 
рий выполнен до конца, и при этом не встретились операторы ехії или 091е, Рей 
неявно вызывает ехії(0), сообщая вызывающей программе об успешном выпол- 
нении. (Такое поведение несвойственно обычным программам на языке С, кото- 
рые могут вернуть случайное число при завершении без кода возврата.) 


1 Возможно, будет удобнее использовать для переключения версий специально предна- 
значенную для этого программу ре Ъгем. — Прим. науч. ред 
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#1 и кавычки в системах, отличных от ИМХ 


Механизм #!, используемый в ОМІХ, можно эмулировать в других системах: 
М$-рО5 


Создайте пакетный файл для запуска вашей программы и закодируйте его со- 
гласно АГТЕВМАТТУЕ_ЗНЕВАМб. Дополнительные сведения можно почерпнуть из 
файла д05іѕћ.Һ в корневом каталоге дистрибутива с исходным кодом Рег]. 


05/2 
Поместите строку: 


ехїргос рег1 -9 -уоиг_$м1тсНе$ 


первой в файле *.ста (-5 позволяет обойти ошибку обработки «ехіргос» 
в ста.ехе). 


УМ5 
Поместите в начале программы строки: 


Х рег1 -тузм `Е$епу("ргоседиге”)° °р1` ‘`р2° "р3' 'р4’ *р5’ '"р6'` *р7’ *р8’ 1 
$ех1 {++ + ++$татиз != 0 апд $ехії = $+а+иѕ = ипдеѓ; 


где -туѕш обозначает ключи командной строки, которые нужно передать Рен. 
После этого можно вызвать программу как процедуру ОСИ. (команда @ргодгап), 
непосредственно введя с клавиатуры рег] ргодгат, или неявным образом через 
рс $РАТН, используя лишь имя программы. Это «заклинание» немного сложно 
запомнить, но Ре! отобразит его, если вы введете рег1 `-\:зтагфрег1". Если вам 
и этого не запомнить... что ж, затем вы и купили эту книгу. 


Утаоиз 


При использовании дистрибутива Асйуе {зе Рей в какой-либо версии опера 
ционной системы Місгоѕоѓі Міпдомѕ (а именно Міп95, Уіп98, М7 1п0 0,1 УЛоМТ, 
но не \т3.1), процедура установки Рег модифицирует реестр Міпӣоуѕ, свя- 
зывая расширение .рі с интерпретатором Рег. 


При установке версии Ре! от другого производителя, включая версии для 
Уіп82 с официального сайта, модифицировать реестр М п4о\з придется вруч- 
ную. 

Обратите внимание, что при использовании расширения .р Міпаоуѕ не смо- 
жет отличить выполняемую программу Регі от файла «библиотеки регі». Что- 
бы избежать этого, можно использовать для программ Ре! расширение .ріх. 
В последнее время масштабы этого бедствия уменьшились, поскольку боль- 
шинство модулей Рег] теперь имеет расширение ‚рт. 


Интерпретаторы команд в системах, отличных от ОМІХ, часто имеют совершен- 
но другие представления о применении кавычек. Необходимо знать, какие спе- 
циальные символы использует интерпретатор команд (обычно это *, \ и ") и как 
представлять пробельные символы и специальные символы, чтобы запускать од- 
нострочные программы посредством ключа -е. Может также потребоваться заме- 
нить одиночный % на %% или преобразовать его иным образом, если символ про- 
цента является для вашего интерпретатора команд специальным. 


т Приносим извинения за технические неполадки... 
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В некоторых системах может потребоваться заменить одиночные кавычки двой- 
ными. Только не делайте этого в системах ОМІХ или Р1ап9, а также в интерпре- 
таторах команд в стиле 9ОМХ, таких как системы из МКЗ ТооКЁ или пакета 
Сум, производимого ребятами из Суёпиз, входящей теперь в Ве Ба%. Новый 
эмулятор ОМХ под названием Іпіегіх, разработанный в Місгоѕоѓї, тоже начина- 
ет выглядеть э-э... интериксно. 


Например, в ОМІХ (включая Ыпих и ОЗ Х) командная строка будет выглядеть так: 
Х рег1 -е ‘ргіпё “Не110 иог19\п”° 

Вид командной строки в УМБ: 
$ рег1 -е "ргіпі ""не110 мог19\п””” 


или с 00//: 
$ рег1 -е "ргіпї дд(Не110 мог19\п)” 

А в М5-0085 и прочих: 
А:> рег1 -е “ргапЕ \"Не110 мог19\п\” 

или с 94// для выбора собственных кавычек: 
А:> рег1 -е ргапт 99(Не11о мог19\п)” 


Проблема в том, что ни один из этих способов не надежен: его работоспособность за- 
висит от используемого интерпретатора команд. Здесь нет общего решения, и царит 
полнейшая неразбериха. Если вы работаете в системе, отличной от ОМІХ, но вам 
нравится командная строка, постарайтесь приобрести интерпретатор команд по- 
лучше того, что установлен изначально, это не должно оказаться сложным делом. 


Или пишите все на Регі и забудьте об однострочниках. 


Местонахождение Рей 


Это может казаться очевидным, но Рег] полезен, толькс когда пользователь легко 
может найти его. Если это возможно, хорошо, чтобы /изг/Ыпт/рей и /изгЛоса/ыт/ 
рей были символическими ссылками на фактический исполняемый модуль. Ес- 
ли это невозможно, системному администратору настоятельно рекомендуется по- 
местить Рег! и сопутствующие утилиты в каталог, входящий в стандартный путь 
поиска РАТН пользователя или другое удобное место. 

В данной книге мы используем стандартное обозначение #!/_5г/51п/ре’] в первой 
строке программы -— независимо от конкретного механизма, действующего в сис- 
теме. Чтобы запустить конкретную версию Регі, используйте точный путь: 


#1 /иѕг/1оса1/ріп/рег15. 14 0 


Если вы хотите запустить версию не ниже некоторого номера, но не возражаете 
против более высоких номеров, поместите такую команду в начале программы: 


иѕе м5. 14.0; 


(Замечание: ранние версии Рег] используют такие номера, как 5.005 или 5.004 05, 
Сегодня мы считали бы их версиями у5.5.0 и у5.4.5, но версии Рег! старше У5.6.0 не 
понимают таких обозначений. Форма изе 5.№МММ является самой безопасной и гаран- 
тирует обратную совместимость с продуктами из глубин прошлого тысячелетия.) 
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Ключи 


Ключ командной строки из одного символа без аргумента всегда можно связать 
с ключом, который следует за ним. 


#1! /изг/о1п/рег] -зр1.бак # то же, что и -5 -р -1.бак 


Ключи (ѕшйсћеѕ) называют также опциями (орНопз), или флагами (Навз). Как бы 
вы их ни называли, вот как их понимает Ре: 


= Прекращает обработку ключей, даже если следующий аргумент начинается 
знаком «минус». Другого действия не оказывает. 


-ОрІбІТЅ 


Задает разделитель входных записей ($/) в виде восьмеричного или шестна- 
дцатеричного числа, представляющего код символа. Если 016175 отсутствует, 
разделителем становится символ МОТ. (т.е. 0+0000, "0" в Рей). До или после 
числа могут находиться другие ключи. Например, если в системе установле- 
на версия ѓіла(1), способная выводить имена файлов, оканчивающиеся нуле- 
вым символом, можно написать так: 


Х Ғіпд -пате "*.рак” -ргіпїо | рег1 -пде ип1іпк 


Особое значение 00 заставляет Регі читать файлы в режиме абзацев, что экви- 
валентно установке переменной $/, равной "”. А любое значение от 0400 до 0777 
заставляет проглатывать сразу целые файлы, но в соответствии с соглашения- 
ми обычно используется значение 0777, что эквивалентно неопределенному 
значению переменной $/. Мы используем 0777, поскольку символа АЗСИ с та: 
ким значением нет. (К несчастью, символ Юникода с таким значением суще- 
ствует: тАТИУ МАШ, ГЕТТЕВ О УЛТН ЅТКОКЕ АМР АСОТЕ — маленькое латинское «0» 
со штрихом и акутом, но что-то подсказывает нам, что вы не станете исполь- 
зовать его в качестве разделителя своих записей. Если же внезапно вам это 
потребуется, просто укажите его код в шестнадцатеричном виде: -0х1ЕЕ.) 


Символ-разделитель можно также указать в шестнадцатеричном виде: 
-ОхННн..., где каждый символ «Н» обозначает допустимую шестнадцатерич- 
ную цифру. В отличие от восьмеричной формы записи, данная форма может 
использоваться для определения любых символов Юникода, даже находя- 
щихся за границей ОхЕЕ. (Это означает, что вы не сможете использовать 
ключ -х с именем каталога, состоящим только из шестнадцатеричных цифр.) 


-а Включает режим авторазбивки, но только когда используется в сочетании 
с ключом -п или -р. В неявном цикле мі1е, организуемом ключами -п и -р, 
сначала неявно вызывается функция 5р1ії, разбивающая строку в массив 
слов @Е. Поэтому команда 


% рег1 -апе "ргіпі рор(@г), “\п"; ° 
эквивалентна: 


ІІМЕ. ме (<>) { 
@Ғ = 5р111(` `), 
ргіпі рор(@Ғ), “\п”; 
} 


Задать другой разделитель полей можно с помощью ключа -Ё, указав в нем ре- 
гулярное выражение для $р1ії. Например, следующие вызова эквивалентны: 


558 Глава 17. Интерфейс командной строки 


Х амк -Е: ‘$7 && $7 1- / \/біп/' /етс/раззмд 
Х рег1 -Е: -1апе ‘ргапе і? $Е[6] && $Е[6] !- т(7/біп)` /етс/раз$ма 


-с Заставляет Рен проверить синтаксис сценария, а затем завершить работу, не 
выполняя скомпилированный код. Технически этот ключ не ограничивчет- 
ся проверкой синтаксиса: выполняются все блоки ВЕСІМ, ИМТТСНЕСК м СНЕСК, 
а также директивы и5е и по, поскольку считается, что они обрабатываются до 
выполнения программы. Однако блоки 1\Т и ЕЮ не выполняются. Прежний 
режим (который редко оказывается полезен) можно получить, поместив 
в конце основного сценария: 


ВЕСТМ { $^С = 0; ехії; } 
Дело здесь в том, что переменная $`С отражает значение ключа -с. 
-С[Глитьег| 1131] 


Ключ -С управляет некоторыми особенностями Рег, связанными с обработ- 
кой Юникода. За ключом -С может следовать число или список букв. Допус- 
тимые буквы, их числовые значения и оказываемые эффекты перечислены 
в табл. 17.1; список букв эквивалентен сумме соответствующих чисел. 


Таблица 17.1. Значения для ключа -С 


Буква| Шестнадцате- | Значение 


ричное число 


Предполагается, что ЭТОТМ работает в режиме ОТЕ-8. 
Предполагается. что 5ТООЦТ работает в режиме ОТЕ-8. 
Предполагается, что ТЕВЕ работает в режиме ОТЕ-8. 
Т+О+Е 

ОТЕ 8 – кодировка по умслчанию в Рег110 для потоков ввода. 


о ыо м 


=, 


ОТЕ-8 – кодировка по умолчанию в Рег! 10 для потоков вывода. 
1+0 


ь Бо 


Ожидается, что элементы в ВАЯбУ являются строками в коди- 
ровке ОТЕ-8. 


Обычно символы «/ОЕюА» действуют безусловно; добавление 
І, делает их зависимыми от значений переменных среды, опре- 
деляющих региональные настройки (1С А, 1С_ТУРЕ и ТАМ в по- 
рядке уменьшения приоритета) - если переменные указывают 
на кодировку ОТЕ-8, тогда выбирается комбинация «1ОЕЮА,. 


“ 


Устанавливает ${^ПИТЕВСАСНЕ} в значение -1, чтобы обеспечить 
кэширование кода в режиме отладки в кодировке ОТЕ-8. Ве- 
роятно, бессмысленно, если только вы не собираетесь занять- 
ся отладкой или переделкой внутренних механизмов Рен. 


Например, комбинация -СОЕ и ее числовой эквивалент -С6 включают ре- 
жим поддержки кодировки ОТЕ-8 для потоков вывода ЭТОТ и ЭТОЕВН. Повто- 
ряющиеся буквы не являются ошибкой, но и никакого дополнительного эф- 
фекта не производят. 


Комбинация іо означает, что ко всем последующим вызовам ореп (или анало- 
гичным операциям ввода/вывода) в области видимости текущего файле бу- 
дет неявно применяться фильтр :иї#8 Рег110. Иными словами, будет предпо- 
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-4 
-а? 


лагаться, что входной текст имеет кодировку ОТЕ-8, и выводиться данные 
будут тоже в кодировке ОТЕ-8. Однако это всего лишь умолчания, которые 
можно переопределять, явно указывая фильтры в ореп и біпподе. 


Сам по себе ключ -С (без букв или цифр, следующих за ним) или пустая стро- 
ка `` в переменной среды РЕН. _ОМТСОВЕ имеют тот же эффект, что и комбина- 
ция -СЅрІ,. Иными словами, стандартные потоки ввода/вывода и режимы 
открытия файлов будут поддерживать кодировку ОТЕ-8, но только если она 
указана в переменных среды, определяющих региональные настройки. Та- 
кое поведение соответствует неявному поведению поддержки ОТЕ-8 в у5.8.0 
и в настоящее время не приветствуется. 


Вы можете использовать -С0 (или `0" в качестве значения переменной среды 
РЕВЕ_ОМТСООЕ), чтобы явно запретить особенности обработки Юникода, опи- 
санные выше. 


Числовое значение этой настройки отражает волшебная переменная $1^0№1- 
С00Е}. Она инициализируется в процессе запуска Рег], после чего становится 
доступной только для чтения. Если вам потребуется отменить ее действие, 
используйте прагму ореп, или функцию ореп с тремя аргументами, или функ- 
цию біпподе с двумя аргументами. 


(В версиях ниже у5.8.1 ключ -С был доступен только в \/1щ32, где использо- 
вался для перехода на применение функций \\!1132 АРІ с поддержкой Юни- 
кода. Эта особенность почти не использовалась на практике, поэтому данный 
ключ командной строки был «переориентирован».) 


Примечание: начиная с версии у5.10.1, если ключ -С используется в строке 
#1, он также должен фигурировать в командной строке. Это обусловлено тем, 
что к моменту запуска интерпретатора Рей стандартные потоки ввода/выво- 
да уже настроены. Для установки кодировки потоков ввода/вывода можно 
также использовать функцию 01пподе. 


Запускает сценарий в отладчике Рец. См. главу 18. Дополнительный символ 
+ указывает, что отладчик должен выполнять отладку в многопоточном ок- 
ружении. 


-А:МОБИЕЕГЕАВСТ, АВС2] 
-АЕМОБВИЕЕГЕАВСЛ, АВС2] 


Запускает сценарий под управлением отладочного, профилирующегс или 
трассирующего модуля, установленного в библиотеке Рег! как Пеме1::МОрИГЕ. 
Например, -4:ОРго] выполнит сценарий с использованием профилировщика 
Рехе1::рРго#. Как и при использовании ключа -М, пакету 0е\уе1: :МОБШЕ могут пе- 
редаваться параметры для интерпретации их в функции 0е\е1 :: МОБИ Е: :ітрогї. 
Опять же, как и для -М, чтобы вместо функции іпрогї вызвать 0е\уе1 :: МОБИЕЕ:: 
ипітрогї, используйте изе -4:-МОВИЕ. Список параметров, разделенных запя- 
тыми, должен начинаться символом =. Дополнительный символ # указывает, 
что отладчик используется в многопоточном окружении. 


-Р 1ЕТТЕНЅ 
-Р МИМВЕВ 


Устанавливает флаги отладки. (Работает, только если ваша версия Рег] ском- 
пилирована с поддержкой отладки, как описано ниже.) Можно задать число 
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МИМВЕВ, представляющее собой сумму нужных битов, либо список букв 
[ЕТТЕВ$. Например, чтобы увидеть, как выполняется сценарий, используйте 
-Р14 или -РзИ. Другим полезным значением является -21024 или -Рх, выво- 
дящее скомпилированное синтаксическое дерево. Ключ - 0512 или -Ог выво- 
дит скомпилированные регулярные выражения. Числовое значение ключа 
доступно внутри сценария в специальной переменной $0. Значения битов пе- 
речислены в табл. 17.2. Для простоты числа ниже приведены в шестнадцате- 
ричном виде, но в составе ключа они должны передаваться в десятичном ви- 
де. Мы настоятельно рекомендуем использовать буквенные обозначения. 


Таблица 17.2. Опции -р 


Буква | Значение 


0х0400000 
0х2000000 


Проверка целостности внутренних структур («Все ли чисто») 


Дамп определений подпрограмм, включая специальные блоки, та- 
кие как ВЕСІМ№ 


0х0200000 
0х0000020 
0х0008000 
0х0000100 
0х0002000 
0х0080000 
0х0000004 
0х1000000 


Режим копирования при записи (сору-оп-мгіќе) 

Преобразования строка/число 

Сборка мусора по завершении программы 

Обработка форматов 

Дамп хешей – узурпирует уа1оеѕ 

Отобразить $,ї,Р-дебиб в (т.е. не пропуская) операциях в пакете 08: : 
Обход и обработка стека контекста 


Трассировка подстановки значений в операциях интеллектуально- 
го сопоставления 


0х0000080 | т 
0х0000010 
0х0000040 


Распределение памяти и скалярных значений 
Поиск методов и перегрузки 


Вывод профилировочной информации, состояние ввода исходного 
файла 


0х0000001 Выводить результаты лексического и синтаксического разбора 


(с буквой и выводит стек лексического разбора) 
0х0800000 
0х0040000 


Подавить вывод всех сообщений ЕХЕСОТ ІМС 


Включить счетчики ссылок при выводе переменных (например, 
при использовании -Рѕ) 


0х0000200 
0х0000002 
0х0020000 
0х0000008 
0х0001000 


Разбор и выполнение регулярных выражений 

Выводить состояние стеков (с буквой о выводит все стеки) 
Лексический анализ 

Трассировка выполнения 


Для неофициальных пользовательских забав (зарезервировано для 
частного использования) 


0х0000800 
0х0100000 


Проверка меченых данных 


Увеличение детализации вывода: используется в сочетании с дру 
гими флагами 


0х0004000| Х 
0х0000400 


Выделение временной памяти 
Дамп дерева синтаксического разбора 
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Для всех этих флагов требуется исполняемый модуль Ре], скомпилирован- 
ный с поддержкой отладки. По умолчанию Рен компилируется без поддерж- 
ки отладки, поэтому вы не сможете использовать ключ -Р, пока вы сами или 
ваш системный администратор не скомпилируете версию Рег] для отладки. 
Подробности можно найти в файле ІМТАГІ, в каталоге с исходным кодом 
Рец, но вкратце суть состоит в том, чтобы передать компилятору С ключ 
-РРЕВОССТ№МС при компиляции Рен. Этот флаг автоматически устанавли- 
вается, если включить опцию -&, когда Сопѓісиге запрашивает у пользовате- 
ля флаги оптимизатора и отладчика. 


Если вы просто хотите получить распечатку каждой строки программы Регі 
по ходу ее выполнения (аналогично тому, что дает $й -х для сценариев интер- 
претатора команд), ключ Рей -Р не поможет. Вмесго этого нужно сделать 
следующее: 

# Синтаксис интерпретатора команд Борна (баѕћ) 

$ РЕНЬОВ_ОРТ$="КМоп$тор=1 АифоТгасе=1 Ғгате=2" рег1 -05 ргодгат 


# Синтаксис сѕһ 
УХ (зетепу РЕНЕОВ_ОРТЗ “№ оп5фор=1 АифоТгасе=1 Ггате=2”; рег1 -9$ ргодгат) 


За подробностями обращайтесь к главе 18. 


-е РЕВІСОрЕ 


Может использоваться для ввода одной или более строк сценария. Если ука- 
зан ключ -е, Рег не ищет имя файла программы в списке аргументов. Аргу- 
мент РЕЛЕСООЕ рассматривается, как если бы он заканчивался символом пере- 
вода строки, поэтому можно передать несколько ключей -е, чтобы создать 
программу из нескольких строк. (Не забудьте использовать точки с запятой, 
где это необходимо.) Тот факт, что -е добавляет в конец аргумента символ пе- 
ревода строки, не значит, что вы обязаны использовать несколько ключей 
-е, – если интерпретатор команд позволяет заключать в кавычки много- 
строчный текст, как 3й, Ёзй и Баѕћ, сценарий из нескольких строк можно пе- 
редать в одном аргументе -е: 


$ рег} -е ‘рг1пЕ "Ному, "; ргіпї “ӨАВСМ! \п”; мог19 
Ному, мог1а! 


В сзВ лучше передать несколько ключей -е: 


% регі -е ‘`ргіпЕ “Ному, ^;° \ 
-е ‘ргіпЕ "ӨАВСМ! \п"; ° мог1а 
Ному, мог10! 


Учитываются как явные, так и неявные символы новой строки, поэтому 
в обоих случаях вторая команда ргіпі находится на строке 2 сценария -е. 


-Е РЕВЕСОБЕ 


Действует подобно -е, за исключением того, что неявно включает все допол- 
нительные возможности (в единице компиляции паіп). В версии у5.14 таки- 
ми возможностями являются зау, ѕзїаїе, эм Исп и џпісойе ѕїгіпдѕ. См. описа- 
ние прагмы Геатиге в главе 29. 


Запрещает выполнение $Соп_езиейб/зйесизютиге. при запуске. 


Ре можно собрать так, что по умолчанию при запуске он будет пытаться вы- 
полнить $Сопйязиейь/зйесизюптиге.[! (в блоке ВЕСТА). Этг возможность по- 


562 Глава 17. Интерфейс командной строки 


зволяет системным администраторам настраивать поведение Реп. Напри- 
мер, таким способом можно добавлять записи в массив @МС, чтобы Рег] мог 
находить Модули в нестандартных каталогах. 


Фактически Рег! вставляет следующий код: 


ВЕСІМ { 
бо { 
1оса1 $!; 
-# "$Сопғіо(ѕіте116) /51тесиѕтотіге. р1"; 
} && до “$Сопғід{ѕіте110)} /ѕітесиѕтопіге рі"; 
} 


Поскольку в действительности это ао (а не геди1 ге), модуль ѕіѓіесиѕіотіге.рі не 
должен возвращать истинное значение. Код выполняется в пакете паіп, в соб- 
ственной лексической области видимости. Но, если сценарий завершится 
аварийно, переменная $6 не будет установлена. 


Кроме того, значение $С0пғід{511е110} определяется в С-коде, а не извлекается 
из Сопйе.рт, который вообще не загружается. 


Код выполняется на очень раннем этапе. Например, любые изменения, про- 
изведенные в @Т\С, можно наблюдать в результатах работы команды регі -У, 
Разумеется, соответствующие блоки ЕМ№ будут выполняться на самом позд- 
нем этапе. 

Чтобы во время выполнения определить наличие этой возможности, можно 
проверить значение $Сопѓід{иѕеѕіїесиѕіїопіге/: 


$ регі -У:иѕеѕ1їесиѕтот1 те 
иѕеѕітесиѕтотігғе= `џпаде# '; 


-Е РАТТЕВМ 


Задает шаблон для 5р11ї, когда ключ -а включает авторазбивку (в противном 
случае не оказывает никакого действия). Шаблон может быть заключен в сим- 
волы косой черты (//), двойные кавычки ("”) или одинарные кавычки (``). По 
умолчанию он заключается в одинарные кавычки. Не забывайте. что способ 
передачи кавычек через интерпрегатор команд зависит от используемого ин- 
терпретатора. 


-й Выводит справку по ключам командной строки Рег]. 


-і 


-і ЕХТЕМТОМ 


1 


Указывает, что файлы, обрабатываемые посредством конструкции <>, долж- 
ны редактироваться «по месту». Это делается путем переименования входно- 
го файла, открытия выходного файла с исходным именем и выбора этого вы- 
ходного файла в качестве файла по умолчанию для вызовов ргіпї, ргіпїї 
и игЦе/ Аргумент ЕХТЕМ$ТОМ используется для изменения имени прежнего 
файла с целью создания резервной копии. Если он отсутствует, резервная ко- 
пия не создается и перезаписывается текущий файл. Если в ЕХТЕМТОМ нет 
символа *, заданная строка добавляется в конец текущего имени файла. Ес- 
ли ЕХТЕМУТОМ содержит один или несколько символов *, каждый символ * за- 


Технически это не совсем «по месту». Имя файла то же, но физически это другой файл. 
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меняется именем обрабатываемого в данный момент файла. На языке Рей 
это можно выразить как 


($баскир = Фехїепѕіоп) =- $/\*/$Ее_пате/д: 


Благодаря этому к имени резервной копии файла можно добавить не только 
суффикс, но и префикс: 


$ рег1 -р1‘0г19_*° -е `з/Роо/Баг/` хух # создать копию с именем ‘ог19_хух’ 


Резервные копии исходных файлов можно даже поместить в другой каталог 
(при условии, что он существует): 


$ рег1 -р1‘019/*.0г19° -е "ѕ/Ғоо/баг/' хух # создать копию ‘о19/хух. ог10` 
Следующие пары однострочных команд эквивалентны: 


% рег1 -р1 -е ‘з/Роо/Баг/° хух # перезаписать текущий файл 
% рег1 -рі'*" -е "ѕ/Ғоо/раг/' хух # перезаписать текущий файл 


5 рег1 -р1`.0г19° -е `$/Роо/Баг/° хух # сделать резервную копию в 'хух.огід' 
Х рег1 -рі'*.огід’ -е `5/ѓоо/баг/' хух # сделать резервную копию в 'хух.огід' 


Следующая команда: 
Х рег1 -р -1.0г19 -е "з/Роо/баг/; 
эквивалентна программе: 


#1 /иѕг/біп/рег1 -рі.огіб 
3/Роо/баг/; 


что служит удобной сокращенной формой записи существенно более длин- 
ной программы: 


#1 /изг/бзп/рег1 
Фехтепзтоп = ‘.ог1с` 
МЕ. мһіЛе (<>) { 
1+ (ФАВСУ пе $019агом) { 
і? (Фехкепелоп !- /\*/) { 
фбаскир = ФАВСУ бех+епѕіоп: 


} 
е1ѕе { 

(Фбаскир = $ехіепѕіоп) =- 5/\* /$АВбМ/9; 
} 


ип?ез$ (гепате(ФАВСУ, $баскир)) { 
магп "невозможно переименовать $АВСУ в $баскир: $!\п”; 


с1оѕе АВСУ; 
пехї; 
} 
ореп(АВСУОУТ, “>ФАВС\”); 
ѕе1есї(АВСУООТ), 
$010агд\у = $ААСУ; 
} 
з/Роо/баг/; 
} 
сопї1пие { 


огіпі: # вывод в исходное имя файла 


} 
ѕе1ест($Т000Т); 
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Этот длинный фрагмент, в сущности, идентичен простому однострочнику 
с ключом -і, за вычетом того, что в форме с ключом -і не требуется сравни- 
вать ФАНСУ с $010агуу, чтобы узнать, что имя изменилось. Однако в нем исполь- 
зуется АНСУОИТ для выбранного дескриптора файла и восстанавливается 
$ТООЦТ как дескриптор файла вывода по умолчанию после выполнения цик- 
ла. Как и в приведенном коде, Регі создает резервную копию файла независи- 
мо от того, изменился ли в действительности вывод. В описании функции еоѓ 
можно найти примеры ее использованин без скобок для поиска конца каждо- 
го входного файла, если требуется дописывать в конец каждого файла или 
сбрасывать нумерацию строк. 


Если Рен не может создать резервную копию данного файла, как указано 
в ЕХІЕМ№ІОМ, то выводит предупреждение и продолжает обработку остальных 
перечисленных файлов. 


Нельзя применять ключ - для создания каталогов или удаления расшире- 
ний из файлов. Нельзя также использовать его с тильдой `, чтобы обозначить 
домашний каталог, что и хорошо, поскольку некоторые любят включать этот 
символ в имена файлов резервных копий: 


$ рег1 -рі- -е ‘з/Роо/баг/” #11е1 Ғі1е2 Ғі1е3... 


Наконец, ключ -і не препятствует выполнению Реп в отсутствие имен фай- 
лов в командной строке. В этом случае просто не будут созданы резервные 
копии, поскольку нельзя определить исходный файл, и обработка продол- 
жится, как можно было ожидать, с чтением из ТОМ и выводом в 570017. 


-Т ОТВЕСТОВУ 


Каталоги, задаваемые с помощью -Ї, добавляются в начало @1\С, где содер- 
жатся пути поиска модулей. Как и изе 116, ключ -Ї неявно добавляет катало- 
ги, специфические для платформы. Подробности о директиве изе 116 приве- 
дены в главе 29. 

- 

-1 0СІМИМ 
Включает автоматическую обработку конца строки. Его применение, во-пер- 
вых, приводит к удалению символа окончания строки (сһопр), если указан 
также ключ -п или -р, а во-вторых, в $\ записывается значение ОСТМИМ, в ре- 
зультате чего все операторы рг1г{ выводят дополнительно символ окончания 
строки с кодом АЗСП, равным ОСТММ. Если ОСТММ опустить, то -Ї установит 
переменную $\ равной текущему значению $/, обычно — символу новой стро- 
ки. Поэтому. чтобы ограничить строки 80 колонками, введите следующее: 


% рег1 -1ре °`зибз+г($_, 80) = ””° 


Обратите внимание, что присваивание $\ = $/ производится при обработке 
ключа, поэтому разделитель входных записей может не совпадать с раздели- 
телем выходных записей, если за ключом -[ следует ключ -0: 


Х опиҒіпа / -ргапЕ0 | регі -1п0е ‘ргіпї "Ғоџпа $_” 1Р р’ 


В этой команде $\ устанавливается равной символу новой строки, а затем $/ 
устанавливается равной нулевому символу. (Обратите внимание, что 0 ин- 
терпретировался бы как часть ключа -[, если бы следовал непосредственно за 
ним, поэтому мы вставили между ними ключ -п.) 
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-ти -М 


Эти ключи загружают МОШЕ, как если бы вы выполнили ие. Если задать 
-МОБИГЕ вместо МОШЕ, тогда вызывается по. Например, -Мзігісі действует ана- 
логично и5е ѕїгісї, а -М-ѕігісї – аналогично по $1г1ст. 


-т МОВИЕЕ 
Выполняет изе МОБИ Е) перед выполнением сцевария. 
-М МОБИЕЕ 


Выполняет изе МОБШЕ перед выполнением сценария. Команда образуется 
простой интерполяцией оставшейся части аргумента после -М, поэтому 
можно использовать кавычки, чтобы добавить код после имени модуля, 
например -М`МОРОГЕ аш{оо Баг}. Если первым символом после -М или 
-т является дефис (-), тогда инструкция џѕе заменяется инструкцией по. 
Эту особенность можно использовать для определения минимальной до- 
пустимой версии Рен. Например, -Мь5.14 гарантирует, что сценарий будет 
выполняться только под управлением Регі версии у5.14 или более поздней. 


-М МОРИ Е=ААС1, АВС2... 
Маленькое синтаксическое удобство, позволяющее указать -Мтоаше= 
роо,баг вместо более длинной формы -М'тоаиіе ди{рюо Баг}. Такая форма 
позволяет обойтись без кавычек при импортировании символов. Факти- 
чески -Мтоаиіе=јоо,Баг генерирует следующий код: 


изе тоди1е $р11т(/,/, 9{Ғоо, оаг}) 
Важно учитывать, что в формате со знаком = нет разница между -т и -М, 
однако, во избежание путаницы, предпочтительнее использовать ключ -М. 


Ключи -М и -т можно использовать только при вызове Рен из командной 
строки, но не как параметры в строке #!. (Если нужно вставить их в файл, 
почему вместо этого просто не использовать эквивалентные ие или по?) 


-Р Был ликвидирован в Ре! версии у5.12 из-за проблем с переносимостью. Ис- 


-п 


пользуйте вместо него модуль Техї::СРР из СРАМ. 


Предписывает Ре! выполнять сценарий в цикле, как показано ниже, с аргу- 
ментами имен файлов на манер ѕей -п и ашё: 


МЕ. 
мһіЈе (<>) { 
# здесь вызывается сценарий 


} 


Метку І ІМЕ можно использовать в сценарии, несмотря на то что фактически 
она отсутствует в файле. 


Обратите внимание: по умолчанию строки не выводятся. Если требуется вы- 
вод строк, обратитесь к описанию ключа -р. Вот эффективный способ уда- 
лить все файлы, созданные больше недели назад: 


Ғіпд . -пїіте +7 -ргіпї | рег1 -п1е ип1іпк 


Эта команда выполняется быстрее, чем при использовании ключа -ехес 
в _па(1), поскольку не приходится запускать процесс для каждого найденного 
файла. Этот прием работает некорректно при наличии символов перевода стро- 
ки в путях к файлам, что можно исправить, как показано в примере из описа- 
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ния ключа -0. Поразительное совпадение: блоки ВЕСТ\ и ЕМ позволяют орга- 
низовать перехват управления до или после неявного цикла, совсем как ваш. 


Предписывает Ре! выполнять сценарий в цикле, как показано ниже, с аргу- 
ментами имен файлов на манер ѕей: 


ЕЕ. 
мһі1е (<>) { 
. # Здесь вызывается сценарий 
} 
сопЕ1пие { 
ргіпї || ае “-р деѕїіпат1оп: $!\п”; 


} 


Метку ПМЕ можно использовать в сценарии. несмотря на то что фактически 
она отсутствует в файле. 


Если по какой-либо причине файл, заданный в аргументе, нельзя открыть, 
Рей выведет предупреждение и перейдет к следующему файлу. Обратите 
внимание, что строки выводятся автоматически. Ошибка, возникшая во вре 
мя вывода, считается фатальной. Еще одно поразительное совпадение: блоки 
ВЕСІМ и ЕМ№ можно использовать для перехвата управления до или после неяв- 
ного цикла, совсем как в аш. 


Разрешает элементарный анализ ключей, находящихся в командной строке 
после имени сценария, но предшествующих аргументам с именами файлов 
или ключу «--», завершающему обработку ключей. Все найденные ключи 
удаляются из @АНС\, зато создаются переменные, имена которых совпадают 
с именами ключей. Совмещение ключей в этом случае не разрешается, по- 
скольку -5 позволяет использовать многосимвольные именё ключей. 


Следующий сценарий выведет `їгиє", только если будет запущен с ключом 
-Ѓоо. 


#! /иѕг/б1п/рег1 -$ 
1+ ($700) { ргіпе “гие\п } 


Если ключ имеет вид -ххх=ууу, переменная $ххх устанавливается равной зна- 
чению аргумента, следующего за знаком равенства (в данном случае “ууу”). 
Следующий сценарий выведет “{гие’, только если будет запущен с ключом 
-Ѓоо=Ваг. 

#1 /изг/61п/рег1 -5 

11 ($ғоо ед `баг’) { ргіпт “гие\п” } 


Обратите внимание, что такои ключ, как --ћеір создаст переменную ${-пе1р), 
не совместимую со ѕїтісї геїѓѕ. Кроме того, использование этого ключа в сце- 
нариях, где разрешен вывод предупреждений, может привести к появлению 
фиктивных предупреждений «изе4 оп]у опсе» (используется только один раз). 


Заставляет Ре! использовать при поиске сценария переменную среды РАТН 
(только если имя сценария не содержит символа-разделителя каталогов). 


Обычно этот ключ применяется, чтобы упростить эмуляцию запуска посред- 
ством #! на платформах, не поддерживающих #!. На многих платформах, 
имеющих интерпретатор команд, совместимый с интерпретатором Борна 
или С Вей, можно использовать такую команду: 


1 


Обработка команд 567 


#1 /оѕг/біп/рег1 
ема “ехес /иѕг/біп/рег1і -5 $0 $" 
і? $гиппіпо_ипдег ѕопе ѕће11; 


Система игнорирует первую строку и передает сценарий интерпретатору 
/ріп/ѕћ, который пытается выполнить сценарий Рег! как сценарий интерпре- 
татора команд. Интерпретатор команд выполняет вторую строку как обычную 
команду системы и тем самым запускает интерпретатор Ре. В некоторых 
системах $0 может не содержать полный путь, поэтому -5 сообщает Рей, что 
при необходимости следует найти сценарий. После того как Ре! найдет сцена- 
рий, он выполнит синтаксический анализ строк и проигнорирует их, посколь- 
ку переменная $гипп1п9_ипдег_зоте_зНе11 всегда имеет ложное значение. Более 
удачной заменой $* может стать конструкция ${1+"$6"}, обрабатывающая про- 
белы в именах файлов пробелы и другие специальные символы, но она не ра- 
ботает, если сценарий интерпретируется как сзй-сценарий. Чтобы запустить 
зй, а не сѕћ, некоторые системы должны заменить строку #! строкой, содержа- 
щей просто двоеточие, которую Рег] вежливо проигнорирует. Другие системы 
не могут это контролировать, так что требуют совершенно неимоверной кон- 
струкции, которая будет работать как в сѕћ, ѕћ, так и в регі, например такой: 


ема1 '(ехії $20)` && еуа: ехес /иѕг/оіп/рег1 -5 $0 ${1+"$0"}' 
& еуа1 ‘ехес /иѕг/біп/рег1 -5 $0 $агду:д' 
110; 
Да, сие безобразно!, как и системы, устроенные подобным образом. 


На некоторых платформах ключ -5 также заставляет Рей добавлять суф- 
фиксы к искомому имени файла. Например, на платформах Ут32 добавля- 
ются суффиксы .Раѓ и ‚ста, когда поиск исходного имени оказывается не- 
удачным, а имя не оканчивается одним из этих суффиксов. Если Рег ском- 
пилирован с поддержкой отладки, с помощью ключа Рей -Рр можно посмот- 
реть, как происходит поиск. 


Если переданное имя файла содержит символ-разделитель каталогов (даже 
если путь относительный, а не абсолютный), и файл найти не удается, плат- 
формы, неявно добавляющие расширения имен файлов (не ОМІХ), сделают 
это и будут поочередно искать файлы с этими добавленными расширениями. 


На платформах, схожих с 0ОБ, если сценарий не содержит разделителей 
имен каталогов, его поиск осуществляется сначала в текущем каталоге, а по- 
том в путях из переменной РАТН. На платформах ОМІХ поиск сценария осуще- 
ствляется строго в списке каталогов РАТН из соображений безопасности, тре- 
бующих предотвращения случайного запуска программы из текущего ката- 
лога, когда явного запроса на это нет. 


Действует подобно ключу -Т, но проверка меченых данных генерирует преду- 
прежденин, а не фатальные ошибки. Эти предупреждения можно контроли- 
ровать обычным способом с помощью по магпіпоѕ дм(аіпі). 

Примечание: этот ключ не служит заменой -Т! Он предназначен исключи- 
тельно как временная мера на этапе разработки, для подстраховки устарев- 
шего кода: для действующего кода и для новых программ, создаваемых с ну- 
ля, всегда следует использовать -Т. 


Термин употреблен нами после тщательного рассмотрения. 
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-Т Включает проверки «меченых» данных («іаіпі» сБесК5), которые становится 
возможным использовать. Обычно эти проверки осуществляются только при 
выполнении сценария с установленными битами ѕеёџіа или ѕеіріа. Неплохо 
явно включить их для программ, выполняемых от имени другого пользова- 
теля, таких как программы ССІ. См. главу 20. 


Из соображений безопасности Рег] должен увидеть этот ключ как можно 
раньще; обычно это значит, что ключ следует расположить в начале команд- 
ной строки или строки #!. Если он расположен недостаточно близко к началу 
Рей выразит неудовольствие. 


-и Заставляет Рег! выполнить дамп памяти после компиляции сценария. Теоре- 
тически этот дамп можно превратить в выполняемый модуль с помощью про- 
граммы ип4итр (не входит в комплект поставки Регі). При этом запуск уско- 
ряется ценой некоторого перерасхода дискового пространства (который мож- 
но сократить путем усечения — зѕігірріпє — выполняемого модуля). Если вы 
хотите сначала выполнить часть сценария, а потом — дамп, используйте вме- 
сто этого ключа оператор Ре! дипр. Примечание: наличие программы ипдитр 
зависит от платформы; в некоторых версиях Рег она может отсутствовать. 
Она постепенно вытесняется новым транслятором кода из Ре! в С, который 
отличается лучшей переносимостью (но пока является экспериментальным). 


-( Позволяет Рег выполнять небезопасные операции. В данное время «небезопас- 
ными» считаются только операции удаления каталогов при работе с правами 
суперпользователя и запуск программ с ѕеіџі, для которых непройденные 
проверки меченых данных не являются фатальными, а лишь приводят к вы- 
даче предупреждений. Учтите, что вывод предупреждений должен быть вклю- 
чен, чтобы предупреждения о меченых данных действительно выводились. 


-о Выводит номер версии и уровень патчей выполняемого модуля Рец, а также 
некоторые дополнительные сведения. 


-У Выводит список основных параметров конфигурации Рег] и текущее значе- 
ние @1МС. 


"МАМЕ 


Выводит в 5Т000Т значение указанной переменной конфигурации. МАМЕ может 
содержать символы регулярных выражений, такие как є » для сопоставле- 
ния любому символу и «.-» для сопоставления произвольной последователь- 
ности символов. 


% рег1 -\: тап. біг 
пап1аіг= ' /изг/1оса1 /тап/тап1* 
папЗаіг= ' /изг/1оса1 /тап/тап3” 


Х рег1 -\: °. «Еһгеадйѕ`' 

а о1дріћгеадѕ= ‘опдеГ° 
иѕе50051һгеадѕ= `деҒіпе ' 
иѕеіїћгеайѕ= ` опаде? ' 
џиѕеїћгеайѕ= ‘де 1пе` 


При попытке запросить несуществующую переменную конфигурации, ее 
значение сообщается как “ИМКМОМ\". Внутри программы сведения о конфигу- 
рации можно получить с помощью модуля Сопѓід, однако он не поддерживает 
шаблоны в индексах хешей: 
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У 


-х 


Х рег1 -МСоп?ід -1е ргіпё $Сопғіоќ(тап1діг} ° 
/иѕг/1оса1/тап/тапі 


См. описание модуля Сопѓід. 


Выводит предупреждения о переменных, встречающихся лишь один раз, 
и скалярных величинах, используемых до присваивания им значений. Так- 
же выводятся предупреждения о переопределении подпрограмм и ссылках 
на неопределенные дескрипторы файлов или дескрипторы, открытые только 
для чтения, но используемые для записи. Выводятся также предупреждения 
об использовании в числовом контексте величин, не похожих на числа, об 
использовании массива в скалярном контексте, о рекурсии с глубиной вы- 
ше 100 и о массе других вещей. Все эти сообщения отмечены символами 
«(Ұ)» в рейфав. 

Этот ключ просто устанавливает глобальную переменную $`%\. Он не оказы- 
вает влияния на лексические предупреждения — см. описание ключей -И/ 
и -Х. Включать или отключать отдельные сообщения можно с помощью 
прагмы магпіпоѕ (или по магпіпоѕ), описанной в главе 29. 


Включает безусловный вывод всех предупреждений в программе, даже если 
они отключены локально с помощью по маги1п9$ или $^М = 0. Распространя- 
ется на все файлы, загруженные с помощью изе, гедиіге или бо. Можете рас- 
сматривать этот ключ как Рег-эквивалент команды ііпі(1). 


-х ОТНЕСТОВУ 


-Х 


Предписывает Рей извлечь сценарий, встроенный в сообщение. Весь мусор, 
предшествующий сценарию, отбрасывается, а началом считаегся строка, на- 
чинающаяся с #! и содержащая слово "рег1". Все поддающиеся интерпретации 
ключи в строке после слова "рег!" будут применены. Если задано имя катало- 
га, Рег! перейдет в него перед запуском сценария. Ключ -х способен удалить 
мусор только в начале сообщения, но не в конце. Сценарий должен заканчи- 
ваться меткой __Е\№0__ или __ПАТА__, если в конце есть мусор, который нужно 
проигнорировать. (При желании сценарий может обработать весь мусор в кон- 
це сообщения или его часть с помощью дескриптора файла ГАТА. Теоретически 
этот дескриптор позволяет даже найти начало файла при помощи ѕеек и об- 
работать мусор, предшествующий сообщению.) 


Безоговорочно и до конца выполнения отключает вывод всех предупрежде- 
ний — в точности обратно тому, что делает флаг -И. 
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Вд 


ополнение к различным ключам, явно изменяющим режим работы Регі, мож- 


но устанавливать переменные среды, влияющие на различные основные режимы. 
Способ установки переменных среды зависит от системы, однако есть один прием, 
о котором нужно знать, если вы используете зй, Ёзй или баѕћ: можно временно ус- 
танавливать переменную среды для одной команды, как если бы она была своеоб- 
разным ключом. Эта переменная должна быть установлена перед командой: 


$ РАТН=' /ріп: /иѕг/ріп” рег1 пургоддіе 
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Нечто похожее можно делать в порожденных интерпретаторах для сѕћ и {5й: 
Х (ѕетепу РАТН “/Б1п: /иѕг/ріп"; рег1 мурго9д1е) 


В других случаях переменные среды обычно устанавливаются в некотором фай- 
ле с именем типа .сйзгс или .рго]Ие, находящемся в домашнем каталоге пользова- 
теля. В сѕћ и ісзћ можно сказать: 


Х ѕетепу РАТН `/61п: /изг/Біп' 
Авзй, Еѕһ и базЁ команда будет выглядеть так: 
$ РАТН=' /Біп: /иѕг/6іп'`; ехрогі РАТН 
В других системах есть свои способы установки этих переменных на полупосто- 
янной основе. Вот несколько переменных среды, которые распознает Рег]: 
НОМЕ 
Используется, когда сһііг вызывается без аргумента. 
ШС АШ, (С _СТУРЕ, 1С СОАТЕ, 1С_МУМЕВТС, РЕВЁ_ВАБВКАМВ 
Переменные среды, управляющие обработкой языком Рей данных, характер- 


ных для отдельных естественных языков. См. страницу реғ/осаіе справочно- 
го руководства. 


ГОСрІЋ 
К этой переменной Ре! обращается, когда сһііг вызывается без аргументов, но 
переменная НОМЕ не установлена. 

РАТН 


Используется при запуске подпроцессов и для поиска программ, если указан 
ключ -5. 


РЕВЕ50В 
Команда предназначена для загрузки отладчика. По умолчанию: 
ВЕСІМ№ { гедиіге `рег1500.р1 } 


Дополнительные сведения 06 использовании этой переменной см. в главе 18. 
РЕНЕЗОВ_ТНВЕАВЕВ 


Если эта переменная имеет истинное значение, отладчик будет ВЫПОЛНЯТЬ ОТ- 
ладку в многопоточном окружении. 


РЕВЕ_АО\_МОМ_ТЕЗ_15Р (только в версии для №іп32) 


Если имеет значение 1, разрешает использовать 15Р (Гауеге4 Бегу1се Ргоу1- 
дег — многоуровневый поставщик услуг), несовместимый с ІЕ5 (шэаПаЫе Ее 
Зузет — разрешенная к установке файловая система). Обычно Рег! пытается 
отыскать ІЕЅ-совместимый 15Р, необходимый для интерпретации У/іраӢомз- 
сокетов как действительных дескрипторов файлов. Однако это может вызы- 
вать проблемы при наличии брандмауэров, таких как МсА/ее Сиагаіап, тре- 
бующих, чтобы все приложения использовали его ГР, не совместимый сІЕ5, 
из-за чего Рег1 обычно старается не использовать такие ІР. 


Запись значения 1 в эту переменную среды требует, чтобы Рег] просто исполь- 
зовал первый подходящий 15Р, имеющийся в каталоге, удовлетворив требова- 
ния МсАѓее Сиагаіап (и в этом конкретном случае Регі тоже сохранит работо- 
способность, потому что 15Р брандмауэра МсАѓее Сиагііап в действительно- 
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сти предпринимает дополнительные усилия, чтобы обеспечить работоспособ- 
ность приложений, требующих совместимости с ІЕЭ). 


РЕВЬ_РЕВУб_МЗТАТ$ 


Применяется, только если Рег! скомпилирован с функцией па110с (т.е. если 
регі -У:а тутаиос возвращает “де 1пе”). Если переменная установлена, тс по- 
сле выполнения возвращается статистикг. использования памяти. Если пере- 
менная установлена равной целому числу, превышающему единицу, стати- 
стика распределения памяти выводится и после компиляции. 


РЕВ _ ВЕЅТАОСТ СЕМЕ. 


Применяется, только если Ре! скомпилирован с поддержкой отладки, и управ- 
ляет режимом глобального удаления объектов и других ссылок. Дополнитель- 
ную информацию можно найти в разделе «РЕВ. РЕБТЕОСТ ТЕУЕГ, на стра- 
нице регіћаскіірз (ћіір://регійос.регі.ога/регіћасЕїіірѕ.Һті). 


РЕВЕ_ОЕ_МОМЕАРУ 


Установите эту переменную в значение 1, чтобы заставить Реп искать все неоп- 
ределенные символы во время загрузки динамической библиотеки. По умол- 
чанию поиск символов производится при первой попытке их использования. 
Настройка этой переменной может пригодиться при тестировании расшире · 
ний, поскольку гарантирует появление сообщений об ошибках при наличии 
опечаток в именах функций, даже если эти функции не вызываются тестами. 


РЕВЕ_ЕМСООТМС 


Не используйте эту переменную. Она опирается на неработоспособную прагму 
епсоаіпд. 


РЕВ _НАЅН__ЅЕЕО 


(Начиная с у5.8.1.) Используется для рандомизации внутренней хеш-функции 
Реті. Для имитации поведения, «предшествовавшего версии 5.8.1», присвойте 
этой переменной целое число (ноль соответствует поведению у5.8.0). Фраза 
«предшествовавшего версии 5.8.1» означает, кроме всего прочего, что ключи 
хешей всегда будут генерироваться в том же порядке при каждом запуске Рег]. 


По умолчанию большинство хешей возвращает элементы в том же порядке, 
что и в Ре!] версии у5.8.0. Если при вставке ключа в любой хеш обнаружива- 
ются патологические данные, этот хеш переключается на альтернативную 
случайную последовательность хеш-ключей. 


Рандомизация выполняется по умолчанию, если переменная РЕНЕ_НАЗН_ЗЕЕБ 
не установлена. Если Ре скомпилирован с флагом -РОЅЕ НАЅН БЕЕР_ 
ЕХРИСТТ, рандомизация по умолчанию не выполняется, если переменная 
РЕВЕ_НАЗН_ЗЕЕВ не установлена. 


Если переменная РЕЋІ_НАЅН_$ЕЕ0 не установлена или имеет нечисловое значе- 
ние, для определения начального значения последовательности псевдослу- 
чайных чисел используется генератор псевдослучайных чисел, предоставляе- 
мый операционной системой и библиотеками. 


Имейте в виду, что начальное значение последовательности псевдослучай- 
ных чисел является критичной информацией с точки зрения безопасности. 
Рандомизация хешей выполняется с целью защититься от локальных и уда- 
ленных атак на код Ре]. При установке начального значения последовательно- 
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сти псевдослучайных чисел вручную эта защита может быте частично или пол- 
ностью нарушена. За дополнительными сведениями обращайтесь к разделу 
«А1еог пас Сотр1Іехіу АЦасКз» в реліѕес (вНр://рейдос.рей ота/рейзес.тй) 
и к разделу «ЕМУІКОММЕМТ» в рейгип (ћёр://регійос.регі.ога/регігип .Һ№ті). 


РЕН: _НАЗН_ЗЕЕб_ОЕВУб 


(Начиная с у5.8.1.) Установите значение 1 в этой переменной для вывода 
(в ЅТ”ЕВА) начального значения последовательности псевдослучайных чисел 
для хеш-функции при запуске сценария. Эта переменная в паре с переменной 
РЕА _НАЅН_5ЕЕ0 [см. раздел «РЕВГ_НАЗН_ЗЕЕБ» в рейгип (ћіір://регійос.регі. 
огв/регігип.ћ№ті!)] предназначена для отладки случайных ошибок, обуслов- 
ленных рандомизацией хеш-функции. 


Имейте в виду, что начальное значение последовательности псевдослучай- 
ных чисел является критичной информацией с точки зрения безопасности. 
Зная это значение, можно реализовать атаку на код Рег] даже удаленно. За до- 
полнительными сведениями обращайтесь к разделу «Аоки тие Сотріехіїу 
Аібаскѕ» в рейзес (Р11р://регіаос.регі.огв/регіѕес.Ыті). Не раскрывайте это 
значение тем, кто не должен его знать. См. также описание функции һаѕћ_ 
зееа() в модуле Наз!:: 0111. 


РЕВЕ_МЕМ_10б 


Если компиляция вашей версии Реп выполнялась с флагом -Ассѓ1адѕ=-РРЕВЕ_. 
МЕМ_10б, установкой переменной среды РЕНЁ_МЕМ 106 можно включить ведение 
журнала отладочных сообщений. Значение переменной имеет вид питбег[п][5] 
[0], где питбег – это номер дескриптора файла, куда следует выполнять запись 
(2, по умолчанию), а комбинация букв определяет необходимость вывода ин- 
формации об операциях с памятью (т)етогу и/или скалярными значениями 
(3) у, а также информацию о текущем времени (#)ітеѕќатр. Например, РЕН: _ 
МЕМ_106=1м${ обеспечит вывод всей информации в 5Т000Т. Можно также указать 
дескриптор любого другого открытого файла: 


раѕһ$ З>ҒооЗ РЕВЕ_МЕМ_106=Зт рег1 


РЕНЕ_ВООТ (только в версии для УМ$) 


Логическое устройство и путь к корневому каталогу установки Рей для включе- 
ния в @Т№С, только для ОС УМЕ. К переменным среды, оказывающим влияние на 
Рен, в системе УМ$ также относятся РЕНЕЗНА, РЕВІ ЕМУ ТАВІЕЅ м $У5$ТТМЕРОМЕ_ 
ОТЕРЕВЕМТТА(, но все они являются необязательными, и их описание можно най- 
ти в регіотз, а также в файле ВРЕАРМЕ.отз, входящем в дистрибутив с исход- 
ными текстами Рег]. 
РЕВЕ_ЭТСМАЕ$ 

Для Рей версии у5.8.1 и более поздних. Если установлена в значение ипѕаѓе, 
обработка сигналов выполняется (немедленно, но небезопасно) как в версиях 
Рей до 5.8.0. Если установлена в значение ѕаѓе, используется алгоритм без- 
опасной (отложенной) обработки сигналов. См. раздел «Ое{еггей Ѕієпа]ѕ (Баѓе 
512п1а15)» в регіірс (ћі1р://регійос.регі.оге[регіірс.ћіті). 


РЕВЁ-5ЗНЕЦ. (только в версии для Місгоѕоѓі) 


Может устанавливать альтернативный командный процессор (интерпретатор 
команд), который Рег| должен использовать внутренне для выполнения ко- 
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манд через обратные апострофы или вызовы зузтет. По умолчанию это ста.ехе 
/х/с в \УшМТ и соттапа.сот /с в У 1195. Предполагается, что в качестве раз- 
делителя в значении выступают пробелы. Каждому символу, который должен 
быть экранирован (такому, как пробел или обратная косая черта), должна 
предшествовать обратная косая черта. 


Обратите внимание, что Рег] не использует в этих целях переменную СОМЅРЕС, 
поскольку для нее пользователи находят самые разные применения, что вы- 
зывает проблемы переносимости между платформами. Кроме того, если Ре 
будет работать с интерпретатором команд, непригодным для интерактивной 
работы, установка такого интерпретатора в СОМЗРЕС может помешать правиль- 
ному функционированию других программ (которые обычно ищут в СОМЅРЕС 
интерпретатор, пригодный для интерактивного использования). 


РЕВЕЗЕТВ 


Список каталогов, разделенных двоеточиями!, где следует искать библиотеч- 
ные файлы Рен, прежде чем заглядывать в стандартную библиотеку и в теку- 
щий каталог. Если в указанных каталогах существуют специфические для 
данной архитектуры каталоги, они автоматически включаются в путь поиска. 
Для обратной совместимости с более старыми версиями при неопределенной 
переменной РЕЋІ511В осуществляется обращение к РЕВ ТВ. 


При проверке меченых данных (если программа запущена с битами ѕеѓиій или 
ѕеіғ1а, либо с ключом -Т) переменные, определяющие порядок поиска библио- 
тек, не используются. В такие программы следует включать директиву изе 115. 


РЕВЕЗОРТ 


Ключи командной строки по умолчанию. Ключи из этой переменной исполь- 
зуются, как если бы они присутствовали в каждой командной строке Рец. До- 
пустимы только ключи -ЃРІМОатш]. При проверке меченых данных (если 
программа запущена с битами зе или зеёе14, либо с ключом -Т) эта пере- 
менная игнорируется. Если РЕҢІ 50РТ начинается с -Т, включается проверка ме- 
ченых данных, а все последующие ключи игнорируются. 


РЕВЬТО 


Список фильтров Рег110, разделенных пробелами (или двоеточиями). Если при 
сборке подсистема ввода/вывода Рег! была настроена на использование Рег110, 
эти фильтры оказывают влияние на операции ввода/вывода Регі. 


Имена фильтров обычно начинаются двоеточием (например, :репіо), чтобы 
подчеркнуть их сходство с «атрибутами» переменных. Но код, выполняющий 
анализ строк с определениями фильтров (который также используется для ана- 
лиза переменной среды РЕВЕТО), интерпретирует двоеточия как разделители. 


Если переменная РЕНІ10 не определена или содержит пустое значение, исполь- 
зуется набор фильтров по умолчанию для текущей платформы. Например, 
юпіх:рег1іо — в ОМГХ-подобных системах, и :ип1х:с ТР — в Міпӣоуѕ и в других 
ГрО8-образных системах. 


Список определяет фильтры по умолчанию для всех операций ввода/вывода. 
По этой причине в списке могут указываться только встроенные фильтры, по- 
скольку внешние фильтры, такие как :епсод1пд([АУЕР), должны загружаться 


В ОМІХ и ОМТХ-подобных ОС, а в Місгоѕоѓ+ в качестве разделителя - точка с запятой. 
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отдельно перед их использованием. См. описание прагмы ореп в главе 29, где 
рассказывается, как обеспечить возможность использования внешних фильт- 
ров по умолчанию. 


Возможно, кому-то потребуется включить некоторые фильтры в переменную 
среды РЕВІ 10, поэтому ниже приводится их краткое описание. 


:руїеѕ 


СИ 


:ттар 


:рег11іо 


:рор 


‚гам 


:81010 


10піх 


ИЕ Е8 


Псевдофильтр, отключающий действие флага :и1#8 для нижележаще- 
го фильтра. Маловероятно, что встретится в глобальной переменной 
среды РЕВ! ТО сам по себе обычно применяется в сочетаниях :сгіѓ:буїеѕ 
и :рег110:буїеѕ. 


Фильтр, преобразующий СВТ. в “\п". Различает «текстовые» и «двоич- 
ные» файлы по аналогии с М5-ООБ и похожими операционными систе- 
мами. (В настоящее время вся имитация поведения М5-рОЅ сводится 
лишь к распознаванию символа Сопго(-7 как признака конца файла.) 


Фильтр, реализующий «чтение» файлов с применением ппар, помещая 
файл (целиком) в адресное пространство процесса, а затем используя 
его в качестве «буфера» Рег110. 


Повторная реализация «ЭТОЮ-подобного» механизма буферизации 
в виде «фильтра» Рег110. Фактически, :рег110 обращается к нижележа- 
щим фильтрам для выполнения своих операций (обычно :ипіх). 


Экспериментальный псевдофильтр, удаляющий самый верхний фильтр. 
Обращайтесь с ним так же осторожно, как с нитроглицерином. 


Псевдофильтр, управляющий другими фильтрами. Применение фильт- 
ра гам эквивалентно вызову 01птоде($п). Он заставляет поток переда- 
вать каждый байт как есть, без какого-либо декодирования. В частно- 
сти, запрещает преобразование СВТ. и отменяет действие флага :и1#8. 


В отличие от ранних версий Рег], сейчас :ган не ограничивается тем, 
чтобы инвертировать действие флага :сг1{. Действие других фильтров, 
которые могут оказывать влияние на двоичную природу потока, так 

же отменяется. 


Этот фильтр реализует интерфейс Ре'110, обертывая вызовы стандарт- 
ной библиотеки ввода/вывода АМЯТ С. Обеспечивает не только ввод/ 
вывод, но и буферизацию. Обратите внимание, что фильтр :51010 не вы- 
полняет преобразование СВГЕ, даже если это является обычным пове- 
дением для платформы. Для этого следует явно использовать фильтр 
‚СИ располагающийся выше. 


Самый нижний фильтр, вызывающий функции геабй, игЦе, 1зеек и дру- 
гие. 


Псевдофильтр, позволяющий флагу уровнем ниже сообщить Регі, что 
вывод должен производиться в кодировке ОТЕ-8, а ввод должен интер- 
претироваться как текст в кодировке ОТЕ-8. Он не выполняет провер- 
ку корректности кодировки, поэтому входные данные должны обраба- 
тываться с особой осторожностью. Используя этот фильтр для ввода, 
всегда включайте (желательно фатальные) предупреждения, связан- 
ные с проверкой кодировки ОТЕ-8. Или используйте :епсо91пд(ИТЕ-8) 
при чтении данных в кодировке ОТЕ-8. 
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:м1п32 На платформах №132 этот экспериментальный фильтр использует 
«родные» для этой платформы «дескрипторы» системы ввода/вывода 
вместо ОМІХ-подобных числовых дескрипторов файлов. Известно, что 
в версии у5.14 этот фильтр содержит некоторые ошибки. 


Набор фильтров, устанавливаемых по умолчанию, должен давать приемле- 
мые результаты на всех платформах. 


Для ОМХ и ОМХ-подобных платформ это будет эквивалент «ипіх регііо» или 
«51». Если системная библиотека обеспечивает быстрый доступ к буферу, 
при настройке предпочтение отдается реализации «510», в противном случае 
используется реализация «ипіх регіо». 


На платформах Уіп82 версия у5.14 по умолчанию использует «ипіх с $». Реа- 
лизация «34 1ю» в версии для \/1т32 имеет несколько ошибок или, мягко гово- 
ря, недостатков, в зависимости от того, какой компилятор С использовался для 
сборки Реті ТО. Применение нашего собственного фильтра сг1ѓ в качестве буфе- 
ра позволяет избежать этих проблем и обеспечить большее единообразие. 
Фильтр с", наряду с буферизацией, осуществляет преобразование СВГЕ в "\п". 


В качестве самого нижнего на платформе УіпЗ2 в Реп у5.14 используется 
фильтр ип1х, и, как следствие, С-подпрограммы, манипулирующие числовы- 
ми дескрипторами файлов. Существует экспериментальный фильтр міп32, ко- 
торый, как ожидается, будет доработан в будущем и станет фильтром по умол- 
чанию для платформ У 1132. 


Переменная среды РЕЋІ_10 полностью игнорируется, когда Регі действует в ре- 
жиме меченных данных. 


РЕНЕТО_ОЕВУС 


Если содержит имя файла или устройства, некоторые операции подсистемы 
Рег110 будут отражены в этом файле-журнале, открытом в режиме дописыва- 
ния. В ОМХ обычно используется следующим образом: 


% епу РЕВЕТО_ОЕВУб=/Чем/Еу рег1 ѕсгірѓ .. 
Примерный эквивалент в Міпд2: 


> ѕеї РЕВЕТО_БЕВУб=СОМ 
> регі ѕсгіріЕ 


Эта функция отключается в ѕеіџій-сценариях и в сценариях, запускаемых 
с флагом -Т. 


РЕВЕСТВ 


Список каталогов, разделенных двоеточиями, где следует искать библиотеч- 
ные файлы Ре, прежде чем заглядывать в стандартную библиотеку и в теку- 
щий каталог. Если определена РЕВ 5118, то РЕВШ ТВ не используется. 


РЕНЁ_ОМТСОВЕ 


Эквивалент ключа -С командной строки. Имейте в виду, что это не логическая 
переменная. Запись в нее значения `1" — это неправильный способ «включить 
поддержку Юникода» (чтобы ни подразумевалось под этим). Однако вы може- 
те использовать "0", чтобы «отключить поддержку Юникода» (или просто уда- 
лить переменную РЕН! _ОМТСОГЕ в интерпретаторе команд перед запуском Рен) 
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При работе с текстом наиболее универсальным значением для этой перемен- 
ной является "Аб": оно обеспечивает неявное декодирование @АВС\ из кодировки 
ОТЕ8 и вызов 01птоде для всех трех стандартных потоков — ЗТОТ\, 5ТрОШТ 
и ЗТОЕНН — с фильтром :01#8. Используйте это значение, если предполагается, 
что текст - не просто поток байтов, но последовательность символов в кодиров- 
ке ОТЕ-8. В некоторых случаях еще более полезным может оказаться значение 
“АЗО", но оно приводит также к изменению кодировки по умолчанию для всех 
дескрипторов файлов с двоичной на :иї#8, что может нарушить работу многих 
старых программ, которые предполагают, что работают с двоичными (или тек- 
стовыми, если говорить о Міпаоуѕ) потоками, и потому не утруждают себя вы- 
зовом біпподе. Это особенно характерно для программ ОМХ. Поэтому литеру 
“0” здесь лучше использовать избирательно, для запуска отдельных программ. 


Встроенный фильтр :иї#8 по умолчанию не возбуждает исключения и даже не 
выводит предупреждения, столкнувшись с некорректными данными в коди- 
ровке ОТЕ-8 при вводе, поэтому, чтобы обеспечить корректное поведение при 
использовании фильтра :иї#8 для потоков ввода, необходимо также включить 
предупреждения ит”. Для этого можно указать флаг -Мшагитаз=и {5 в ко- 
мандной строке, чтобы включить предупреждения, и -Мишагитптаз=ЕАТАГи{{5, 
чтобы включить исключения. Это соответствует инструкциям изе магпіподѕ 
“тЕ8” и изе магпіпдѕ РАТАЕ => "иї#8" внутри программы. См. также раздел «По- 
лучение данных в Юникоде» в главе 6. 


5Ү$$1 061М (в версии для УМБ) 


Используется, если сһііг вызывается без аргументов, а переменные НОМЕ и 106018 
не установлены. 


Сам Рег не использует никакие другие переменные среды, кроме тех, которые 
должен сделать доступными выполняемой программе или ее порожденным про- 
цессам. Что до модулей, стандартных или пользовательских, они могут работать 
с любыми переменными среды. Например. прагма ге использует РЕВЕ_ВЕ_ТС и РЕВЕ_ 
ВЕ_СОГОН$, модуль См использует РИО, а модуль СС1 обращается к многочисленным 
переменным среды, устанавливаемым демоном НТТР (т.е. веб-сервером) для пе- 
редачи сценарию ССІ. 


Программы, запущенные с битом зейиа, поступят правильно, если прежде чем 
что-либо делать, выполнят следующие строки (чтобы все было по-честному): 


ФЕММ{РАТН} /ріп: /иѕг/біп , # или что еще нужно 
ФЕМ {НЕШ } /біп/вЕ` і? ехіѕїѕ ФЕМУ{НЕШ); 
де1еїе @ЕМ\У{ам(ТЕЗ СРРАТН ЕМУ ВАЅН_ЕМУ) }: 


Подробности читайте в главе 20. 


Отладчик Реп 


Прежде всего, пытались ли вы пользоваться директивой магпіпо? 


Если вызвать Рег! с ключом -4а, программа будет запущена под управлением от- 
ладчика Рег. Отладчик — это интерактивная среда Ре], выводящая приглаше- 
ния для ввода команд. Команды отладчика позволяют просматривать исходный 
код, устанавливать точки останова, выводить дамп стека вызова функции, изме- 
нять значения переменных и т.д. Любая команда, не распознанная отладчиком, 
выполняется (при помощи еуа1) как код Рег] внутри отлаживаемого в данный мо- 
мент программного пакета. (Чтобы не мешать отлаживаемой программе, инфор- 
мацию о собственном состоянии отладчик хранит в пакете 08.) Этс настолько 
удобно, что часто отладчик запускают, только чтобы интерактивно проверить 
действие конструкций Рен. В таком случае неважно, какая программа отлажи- 
вается, поэтому выберем не особенно содержательную: 


х рег1 -де 42 


Отладчик Регі не является отдельной программой, как это обычно бывает в ти- 
пичной среде программирования. Флаг -4 сообщает компилятору о необходимо- 
сти вставить исходный код в дерево синтаксического разбора, который он будет 
передавать интерпретатору. Это значит, что код должен быть правильно скомпи- 
лирован, прежде чем с ним сможет работать отладчик. Если компиляция успеш- 
на, интерпретатор загрузит особый библиотечный файл, содержащий собственно 
отладчик. 


% рег1 -4 /ра+һ/+о/ргодгат 


Программа остановится непосредственно перед первой инструкцией этапа вы- 
полнения (об инструкциях этапа компиляции рассказывается в разделе «Исполь- 
зование отладчика» ниже) и предложит ввести команду отладчика. Когда отлад- 
чик останавливается, то показывает строку кода, которую собирается выпол- 
нить, а не только что выполненную. 


Встретив очередную строку, отладчик сначала проверит наличие точки останова, 
выведет ее (если находится в режиме трассировки), выполнит действия, опреде- 
ляемые командой а (как описывается далее в разделе «Команды отладчика»), и, 


578 Глава 18. Отладчик Рей 


наконец, выведет командное приглашение, если строка является точкой остано- 
ва или работа выполняется в пошаговом режиме. В противном случае он выпол- 
нит строку обычным образом и перейдет к следующей. 


Использование отладчика 


Командное приглашение отладчика выглядит примерно так: 
08<8> 

или так: 
98<<17>> 


где число показывает количество выполненных команд отладчика. Механизм 
журнала команд в стиле сѕћ позволяет повторно вызывать команды по номеру. 
Например, !17 повторит команду с номером 17. Количество угловых скобок ука- 
зывает на глубину вложенности отладки. Например, более одной пары скобок 
можно увидеть, если, находясь в точке останова, попытаться вывести результат 
вызова функции, в которой также присутствует точка останова. 


Чтобы ввести в отладчик инструкцию, состоящую из нескольких строк, напри- 
мер определение подпрограммы с несколькими операторами, нужно перед пере- 
водом строки, которым обычно завершаются команды отладчика, поместить об- 
ратную косую черту. Например: 


08<1> Рог (1..3) { \ 
сое: ргіпЕ "ок\п"; \ 
сопї: } 
оК 
оК 
оК 


Допустим, вы хотите запустить отладчик со своей программкой (назовем ее 
сатеі Неа?) и остановиться. добравшись до функции с именем 17Ге51е4. Вот как 
это нужно сделать: 


Х рег1 -д сате1_Ғ1еа 
Іоадіпод ОВ гоџтіпеѕ Ргот рег1506.р1 муегѕ1оп 1 07 
Едітог ѕиррогї амаі1аб1е 


Ептег п ог "ПИ Тог һе1р, ог тап рег1деоид Ғог поге пе1р. 


ма1п: : (сате1_{1еа:2): реѕїѕ( 'Басїгіап', 4); 
0В<1> 


Отладчик остановит программу прямо перед первой инструкцией этапа выполне- 
ния (об инструкциях этапа компиляции рассказывается ниже) и предложит вве- 
сти команду. Еще раз напомним, что когда отладчик останавливается, он пока- 
зывает строку, которую собирается выполнить, а не ту, которая только что вы- 
полнена. Строка может выглядеть не совсем так, как в исходном файле, особенно 
если текст обработан препроцессором. 


' Саше! Неа (англ.) – верблюжьи блохи. — Прим. перев. 
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Итак, нужно остановиться, как только программа дойдет до функции 1пѓеѕїед, 
поэтому создадим точку останова: 


08<1> Б 1пРезтед 
08<2> с 


Теперь отладчик продолжит выполнение, пока не наткнется на эту функцию, 
и тогда сообщит следующее: 


паіп: :іпғеѕёіед(сате! _#1еа:8): ту $6и9$ = іпї гапа(3); 


Чтобы увидеть «окно» исходного кода. окружающего точку останова, восполь- 
зуйтесь командой и: 


08<2> м 

5 } 

6 

7 зиб іпғеѕтеа { 

8==>р пу $0095 = 1п1 гапд(3) 
9: сиг $Мазтег; 

10: соптатіпаїе($Маѕ+ег), 
11: магп “пеедз маѕћ” 

12 1Р $Маѕтег && $Мазтег->1за (“Нитап”) 
13 

14: ргіпі “дот $бидз\п” 
08<2> 


Как показывает маркер ==>, текущая строка имеет номер 8, а символ б указывает, 
что строка является точкой останова. Определи мы действие для этой точки оста- 
нова, в строке также присутствовал бы символ а. Точками останова могут быть 
только строки, номера которых сопровождаются двоеточиями. 


Чтобы увидеть последовательность вызовов, попросите отладчик вывести дамп 
стека командой Т: 


08<2> Т 

$ = паіп::іпғеѕїеа са11е гот #і1е `АтриЛаїіоп. рт’ 1іпе 4 

@ = АтоиЛатіоп: :1е93(1, 2, 3, 4) са ед Ғгот 111е сате1 Ғ1еа` 1іпе 5 
таіп::реѕїѕ('басїгіап', 4) са11еа Ғгот Ғі1е сапе1_#1еа` 1іпе 2 


Первый символ ($, 6, или .) указывает, в каком контексте была вызвана функ- 
ция — скалярном, списочном или пустом соответственно. Мы видим три строки 
потому, что на момент вызова вывода стека находились на глубине трех функций. 
Ниже объясняется значение каждой из трех строк: 


• Первая строка говорит, что вы находились в функции паіп::іпѓеѕїеа, когда за- 
пустили трассировку стека. Она сообщает, чтс функция была вызвана в ска- 
лярном контексте из строки 4 файла АтьшаНоп.рт. Она показывает также, 
что функция была вызвана без каких-либо аргументов, т.е. как ёіпѓеѕїеа вме- 
сто обычного іпѓеѕїей(). 


• Во второй строке показано, что функция Апри1аї1оп::1е95 была вызвана в спи- 
сочном контексте из строки 5 файла сате! ћеа с четырьмя указанными аргу- 
ментами. 


• Втретьей строке показано, что пазп: :рез{з была вызвана в пустом контексте из 
строки 2 файла сатеі Пеа. 
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Если имеются инструкции, выполняемые на этапе компиляции, такие как код 
в блоках ВЕСТМ и СНЕСК или директивы изе, то обычно отладчик в них не останав- 
ливается, в отличие от гедиіге и блоков ІМТ, поскольку последние относятся 
к этапу выполнения (см. главу 16). Инструкции этапа компиляции можно трас- 
сировать, если установить опцию Аџїоїгасе в РЕНЕОВ_ОРТ$. 


Существуют некоторые возможности управления отладчиком Ре! из самой про- 
граммы. Например, программа может автоматически создать точку останова 
в некоторой подпрограмме, если запущена под отладчиком. Из кода на Рег! мож- 
но также передать управление отладчику, выполнив следующую инструкцию, 
которая безвредна, если отладчик не запущен: 


$08: :ѕіпд1е = 1 


Если установить переменную $0В::5ѕіпд1е равной 2, получится эквивалент коман- 
ды п, в то время как значение 1 эмулирует команду 3. Чтобы имитировать коман- 
ду ї, нужно установить переменную $08: :{гасе в значение 1. 


Другим способом отладки модуля является установка точки останова на загрузку: 


08<7> Б 10а9 с: /рег1/116/Сагр. рп 
№111 ѕїор оп 10ад о ‘с: /рег1/110/Сагр.рт'. 


с последующим перезапуском отладчика командой В. Более точное прицелива- 
ние осуществляет команда б сопрі1е зибпате, позволяющая остановиться сразу 
после компиляции заданной подпрограммы. 


Команды отладчика 


При вводе команд в отладчике не обязательно завершать их точкой с запятой. Ис- 
пользуйте обратную косую черту для продолжения строк (но только находясь 
в отладчике). 


Поскольку отладчик выполняет инструкции с помощью е\а1, значения пу и 10са1 
уничтожаются после возврата из команды. Если команда отладчика совпадает 
с именем какой-либо функции в вашей собственной программе, просто добавьте 
перед вызовом функции какой-либо символ, который не позволит спутать его 
с командой отладчика, например или +, 


Если объем вывода встроенной команды отладчика превосходит количество строк 
на экране, предварите имя команды символом конвейеризации, и вывод будет 
производиться в постраничном формате: 


08<1> || 


У отладчика есть масса команд, которые мы подразделяем (достаточно произ- 
вольно) на команды пошаговой обработки и прогона, работы с точками останова, 
трассировки, вывода, поиска кода, автоматического выполнения инструкций и, 
разумеется, «прочие». 


Вероятно, самой важной командой является һ – команда вывода справки. Если 
в ответ на приглашение отладчика ввести И ћ, вы получите компактный вариант 
справки, умещающийся на одном экране. Если ввести П СОММАМ, вы получите 
справку по указанной команде отладчика. 


Команды отладчика 581 


Пошаговая обработка и прогон 


Отладчик действует, пошагово выполняя программу строка за строкой. Описан- 
ные ниже команды позволяют управлять тем, какие строки при пошаговом вы- 
полнении отладчик будет пропускать, а на каких останавливаться. 


$ [ЕХРА] 


Команда отладчика ѕ выполняет программу в пошаговом режиме. Это зна- 
чит, что отладчик выполняет очередную строку программы, пока не достиг- 
нет следующей инструкции, при необходимости выполняя вход в подпро- 
граммы. Если очередная строка содержит вызов функции, отладчик останав- 
ливается на первой строке в этой функции. Если команда сопровождается 
выражением ЕХРА, содержащим вызовы функций, последние также выполня- 
ются пошагово. 


п [ЕХРВ] 


Команда п выполняет вызовы подпрограмм, не входя в них, и останавливает- 
ся на следующей инструкции на том же уровне (или более высоком). Если 
команда сопровождается выражением ЕХРА, содержащим вызовы функций. 
они будут выполняться с остановками перед каждой инструкцией. 


<ЕМТЕВ> 


Если просто нажать клавишу Епїег в ответ на приглашение отладчика, будет 
повторно выполнена предыдущая команда п или $. 

Команда . возвращает внутренний указатель отладчика на последнюю вы- 
полненную строку и выводит ее. 


Эта команда продолжает выполнение до возврата из текущей выполняющей- 
ся подпрограммы. Она выводит возвращаемое значение, если установлен па- 
раметр РгіпїВеї, что происходит по умолчанию. 


Точки останова 


оо оние с О е о е А И са 


ИМЕ 

СОМОТТТОМ 

ІІМЕ СОМОТТТОМ 

ЗИВМАМЕ 

ЗИВМАМЕ СОМОТТТОМ 

розфропе $ИВМАМЕ 

розфропе 5ИВМАМЕ СОМОГТТОМ 
сотріїе 5ИВМАМЕ 

1оад ЕДП ЕМАМЕ 


Команда отладчика 0 устанавливает точку останова перед строкой с номером 
ИМЕ, приказывая отладчику остановить выполнение программы в этой точке 
и предоставить вам возможность покопаться в данных. Если номер строки /ІМЕ 
опущен, точка останова создается в строке, которая должна выполняться сле- 
дующей. Если задано условие СОМОТТТОМ, оно проверяется каждый раз перед вы- 
полнением инструкции: остановка происходит, только если значение СОМОТТТОМ 
истинно. Точки останова можно создавать только в начальных строках выпол- 
няемых инструкций. Заметьте, что в условиях не используется оператор іѓ: 


582 
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р 237 $х > 30 
Ь 237 ++$соипЕ237 < 11 
Ь 33 /раттегп/і 


Команда 0 5/ВМАМЕ создает точку останова (возможно, условную) перед первой 
строкой указанной подпрограммы. 5/ВМАМЕ может быть переменной, содержа- 
щей ссылку на код, в этом случае СОМОГТТОМ не поддерживается. 


Существует также несколько способов создания точек останова в коде, кото- 
рый еще даже не скомпилирован. Команда 0 роѕіропе создает точку останова 
(возможно, условную) перед первой строкой подпрограммы $ИВМАМЕ после то- 
го, как она будет скомпилирована. 


Команда б сопрі1е создает точку останова на первой инструкции, которая 
должна быть выполнена после компиляции 5ИВМАМЕ. Заметьте, что в отличие 
от формы 0 роѕїропе, эта команда создает точку останова вне рассматривае- 
мой подпрограммы, на инструкции, которая будет выполнена после компи- 
ляции подпрограммы, а не после ее вызова. 

Форма б 10ад создает точку останова в первой выполняемой строке файла. 


Аргумент ЕП ЕМАМЕ должен представлять полный путь к файлу, как в значе- 
ниях %1МС. 


а 

9 ПМЕ 
Удаляет точку останова в строке с номером / ЈМ, а если номер строки опущен, 
удаляется точка останова в строке, которая должна быть выполненг следую- 
щей. 

0 Удаляет все точки останова. 

- Выводит список всех точек останова и действий. 

С 

с АІМЕ 
Продолжает выполнение, дополнительно предоставляя возможность устано- 
вить одноразовую точку останова в строке с номером / ГМЕ. 

Трассировка 

Т Выводит стек вызовов. 

ї 

+ ЕХРА 
Переключает режим трассировки так, что выводится каждая выполняемая 
строка программы. См. также описание параметра АџїоТгасе далее в этой 
главе. Если задано выражение ЁХРП, отладчик трассирует его выполнение. 
См. также раздел «Автоматическое выполнение» далее в этой главе. 

М 

М ЕХРВ 


Добавляет ЕХРЯ в список глобальных контрольных выражений (шасй ехргез- 
зіопз). Контрольным называется выражение, вызывающее останов при изме- 
нении его значения. Если ЕХРА не задано, все контрольные выражения удаля- 
ются. 
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Вывод данных 


Отладчик Рег! имеет несколько команд для исследования структур данных в мо- 
мент, когда программа прерывается в точке останова. 


р 
р ЕХРВ 


Эта команда оказывает такое же действие, как ргіпі 08::00Т ЕХРА в текущем 
пакете. В частности, поскольку это лишь собственная функция ргіпї, при- 
надлежащая Рей, вложенные структуры данных и объекты не отображают- 
ся, а для их вывода следует использовать команду х. Обработчик ОВ: :00Т осу- 
ществляет вывод на терминал (или в окно редактора) независимо от того, ку- 
да переадресован стандартный вывод. 


х 
х ЕХРВ 


Команда х вычисляет свое выражение в списочном контексте и выводит ре- 
зультат в «красивом» виде. Это означает, что вложенные структуры выводят- 
ся рекурсивно при надлежащей перекодировке непечатаемых символов. 


ү 

\ РКС 

ү РКС МААЅ 
Эта команда выводит все (или только перечисленные в списке \АВ5) перемен- 
ные в указанном пакете РКб (или, по умолчанию, пакете паіп), используя 
«красивую» печить. В хешах выводятся ключи и значения, управляющие 
символы выводятся наглядно, встроенные структуры выводятся в удобочи- 
таемом виде и т.д. Своим действием эта команда напоминает вызов команды 
х для каждой переменной, за исключением того, что х работает и с лексиче- 
скими переменными. Кроме того, идентификаторы здесь следует задавать 
без указания типа, т.е. опуская символы вроде $ или 6. Например: 


ү Реї: : Сатеї РОТ ҒІро 


Вместо имен переменных в уДЁ5 можно использовать шаблон “РАТТЕЯМ или 
!РАТТЕВМ, чтобы вывести переменные. имена которых соответствуют (или не 
соответствуют) заданному шаблону. 

Х 

Х "АВ 
Эта команда представляет собой то же, что и У СИРРЕМТРАСКАСЕ, где СОВВЕМТРАСКАбЕ 
является пакетом, в котором была скомпилирована текущая строка. 

Н 

Н -МИМВЕВ 
Эта команда выводит заданное количество (МИМВЕР) последних команд. В жур- 
нале запоминаются только команды длиннее одного символа (иначе боль- 
шинство из них было бы ѕ или п). Если аргумент МИМВЕЯ опущен, выводятся 
все команды. 


Поиск кода 


С помощью этих команд можно находить и выводить участки программы. 
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ЕТМЕ 
ЅИВМАМЕ 
МІМІМСА 
МІМ-МАХ 


Команда 1 выводит несколько следующих строк программь, или строку 


с номером / ГМЕ, или несколько первых строк подпрограммы 5ИВМАМЕ, или ука: 
занный фрагмент кода. 


ннн 


Команда 1 МІ\М+ІМСЯ выведет І\№СА+1 строк, начиная с ММ. Команда 1 МГ/-МАХ вы- 
ведет строки с номерами с МІУ по МАХ. 


- Эта команда выводит несколько предыдущих строк программы. 


[ЕТМЕ] 
Выводит окно (несколько строк), окружающее строку с номером /ІМЕ (если 
указан), или текущую строку, если номер строки ІІМ опущен. 

Ғ ЕТЕЕМАМЕ 


Позволяет просмотреть другую программу или выражение е\а1. Если ЕЛ ЕМАМЕ 
не является полным именем пути, который можно найти в значениях %1№С, то 
интерпретируется как регулярное выражение для поиска нужного вам файла. 
/РАТТЕВМ/ 
Осуществляет поиск по шаблону РАТТЕРМ в коде программы в прямом направ- 
лении; замыкающий символ / не обязателен. Шаблон РАТТЕЯМ можно опус- 
тить, в этом случае повторяется предыдущий поиск. 
?РАТТЕВМ№ 
Осуществляет поиск по шаблону РАТТЕНМ в коде программы в обратном на- 
правлении; замыкающий символ ? не обязателен. Если РАТТЕЯМ опущен, по- 
вторяется предыдущий поиск. 


= 


5 

$ РАТТЕВМ 

5 !РАТТЕВМ 
Команда $ выводит имена подпрограмм, соответствующие (или, в случае ис- 
пользования префикса !, не соответствующие) шаблону РАТТЕРМ. Если шаблон 
РАТТЕНМ опущен. перечисляются все подпрограммы. 


Действия и выполнение команд 


Находясь в отладчике, можно задать действия, которые должны быть выполнены 
в определенные моменты. Можно также запускать внешние программы. 


а 
а СОММАМО 

а ІІМЕ 

а ГІМЕ СОММАМО 


Эта команда устанавливает действие, которое должно быть выполнено перед 
выполнением строки с номером /1МЁЕ или текущей строки, если номер строки 
опущен. Например, следующая команда приводит к выводу $100 всякий раз, 
когда программа достигает строки 58: 
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а 53 ргіпі "ОВ ЕОЏМО $Роо\п” 


Если параметр СОММАЮ не задан, действие для строки / МЕ удаляется. Если не 
заданы ни / ТМЕ, ни СОММАМ, удаляется действие для текущей строки. 
А Команда А отладчика удаляет все действия. 


< 


<? 

< ЕХРВ 

<< ЕХРВ 
В команде < ЕХРЕ задается выражение Ре1|, которое должно вычисляться пе- 
ред каждым выводом приглашения отладчика. Можно добавить еще одно 
выражение, используя команду << ЕХРВ, вывести список выражений коман- 
дой < ? и удалить все выражения простой командой <. 

> 

> ? 

> ЕХРВ 

>> ЕХРВ 
Команды > выполняются подобно родственным командам <, но после вывода 
приглашения отладчика, а не перед тем. 

{ 

{? 

{ СОММАЮ 

44 СОММАЮ 
Команды отладчика { выполняются аналогично <, но задают не выражение 
на языке Рен, а команду отладчика, которую нужно выполнить перед выво- 
дом приглашения. Если вместо нее ошибочно введен блок кода, выводится 
предупреждение. Если это как раз то, что вам требуется, введите ;{ .. } или 
даже 90 { ... }. 

! 

! МОМВЕВ 

! -МИМВЕВ 

! РАТТЕВМ 


Одиночный ! повторяет предыдущую команду. Аргумент МИМВЕР определяет, 
какую команду из буфера нужно выполнить, например! 5 выполнит третью 
команду, введенную в отладчике. Если аргументу МОМВЕР предшествует сим- 
вол «-», команды отсчитываются в обратном направлении: ! -3 выполнит 
третью от конца команду. Если вместо числа задать шаблон РАТТЕНМ (без сим- 
волов косой черты), выполнится последняя команда, начало которой совпа- 
дает с шаблоном. См. также параметр отладчика геса11Соттапд. 
И С 

Эта команда отладчика выполняет в подпроцессе внешнюю команду СМ, ко- 
торая будет читать данные из 0В::1№ и писать в 0В::00Т. См. также параметр 
отладчика ѕће11Ваго. Эта команда использует интерпретатор команд, указан- 
ный в $ЕМ\/{5НЕЦ }, что иногда может мешать правильной интерпретации ста- 
туса, сигнала и данных дампа памяти. Если нужно, чтобы команда возвра- 


щала правильное значение, установите переменную $ЕМ\{З$НЕС} в значение 
/оіп/ћ.. 
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| 
іОВвСмо 
ПРЕЯЕСМО 


Команда |ОВСМО выполняет команду отладчика ОВСМО, передавая вывод ОВ: :00Т 
программе $ЕМ\{РАСЕН}. Она часто используется с командами, которые выво- 
дят большой объем информации, например: 


0В<1> [М птаіп 


Заметьте, что это относится к командам отладчика, а не к командам, вводи- 
мым из интериретатора команд. Если вы хотите передать результат выполне- 
ния команды шћо программе постраничного просмотра, можно сделать так: 


08<1> 1!мһо | тоге 


Команда ||РЕВІСМО аналогична |ОВСМО, но, кроме того, временно изменяет 
0В::00Т вызовом ѕе1есї, поэтому вывод всех вызовов рг1 пт, рг1п{Р или мгіїе без 
дескриптора файла также будет передаваться по конвейеру. Например, если 
некая функция генерирует большой объем информации вызовом ргіпї, для 
постраничного вывода данных вместо предыдущей следует использовать та- 
кую команду: 


08<1> ѕир ѕаумћо { ргіпі "Џѕегѕ: , мћо` } 
08<2> |[заумпо() 


Прочие команды 

ди `В 
С помощью этих команд осуществляется выход из отладчика. Это предпоч- 
тительный способ выхода, хотя иногда действует дважды повторенная ко- 
манда ехії. Установите параметр іпћірії ехії в значение 0, если хотите ос- 
таться в отладчике по окончании прогона программы. Может также потребо- 


ваться установить $08; :1п15Нед в 0, если вы хотите проследить процесс унич- 
тожения глобальных объектов в пошаговом режиме. 


Я Перезапускает отладчик и начинает новый сеанс. Отладчик пытается сохра- 
нить преемственность работы между различными сеансами, однако некото- 
рые настройки и параметры командной строки могут быть утеряны. В на- 
стоящее время сохраняются следующие настройки: журнал команд, точки 
останова, действия, параметры отладчика и параметры командной строки 
Рен -ш, -Ги -е. 


АЁТАЗ 
АГТАЅ МАШЕ 


Эта команда выводит текущее значение псевдонима АЕ ТА5, если не задано зна- 
чение УАШШЕ. Если оно задано, то определяет новую команду отладчика с име- 
нем 4114$. Если опущены оба параметра, АЕТАб и УАШЕ, выводится список всех 
текущих псевдонимов, например: 


= диії 9 


АІ ТАЅ должен быть простым идентификатором и транслироваться также 
в простой идентификатор. Более сложные псевдонимы можно создавать 
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пап 


путем добавления собственных записей непосредственно в %08::а11а505. 
См. раздел «Настройка отладчика» далее в этой главе. 


пап МАМРАСЕ 


0 
0 
0 
0 


Вызывает программу по умолчанию для просмотра документации с указан- 
ной страницей или, если аргумент МАМРАСЕ опущен, просто запускает эту про- 
грамму. Если этим средством просмотра является программа тап, для ее вы- 
зова используются данные из текущего %Сопѓід. При необходимости автома- 
тически добавляется префикс «рег1», что позволяет вводить в отладчике пап 
дерид и пап ор. 


В системах, где утилита тап отсутствует, отладчик вызывает регіаос; чтобы 
изменить этот режим, установите в $08: :Посста имя средства просмотра, кото- 
рое вам необходимо. Это можно сделать с помощью файла гс или непосредст- 
венным присваиванием. 


ОРТТОМ ... 
ОРТТОМ? 
ОРТТОМЕМАШЕ. 


Команда 0 позволяет манипулировать параметрами настройки отладчика, 
перечисленными в разделе «Параметры настройки отладчика» далее в этой 
главе. Команда 0 ОРТТОМ устанавливает в значение 1 каждый из перечислен- 
ных параметров ОРТТОМ. Если за ОРТТОМ следует вопросительный знак, выво- 
дится текущее значение параметра. 


Команда 0 ОРТ1ОМ-МАШЕ устанавливает значение параметра; если значение 
УАШЕ содержит пробельный символ, его следует заключить в кавычки. На- 
пример, можно задать О радег=“1ез$ -МОе1сзМг“, чтобы [езз использовалась 
с этими конкретными флагами. Кавычки могут быть либо одинарными, ли- 
бо двойными, но при этом нужно использовать управляющие символы для 
внедрения в строку того типа кавычек, в которые она заключена. Необходи- 
мо также экранировать любую обратную косую черту, непосредственно пред- 
шествующую кавычке, но предназначенную для экранирования этой кавыч- 
ки. Иными словами, выполняйте правила заключения в одинарные кавычки 
независимо от того, какой тип кавычек используется на практике. В ответ на 
команду установки параметра отладчик выводит его значение, всегда ис- 
пользуя форму записи в одинарных кавычках: 


08<1> 0 ОРТТОМ=`111$ 15п\ 1 раа 
ОРТТОМ = їһіѕ 15п\ `1 Бад 


08<2> 0 ОРТТОМ=“$ ве ѕаіа, \"Іѕп 1 117\"“ 
ОРТТОМ = Ѕһе за19, "Іѕп\' 147” 


В силу исторических причин присваивание =УАШЕ необязательно, но значение, 
по умолчанию равное единице, устанавливаеются только там, где это допус- 
тимо, т.е. по большей части в логических параметрах. Конкретные значения 
УАШЕ лучше присваивать с помощью =. Имена параметров ОРТ1ОМ можно сокра- 
щать, но делать это, пожалуй, следует, только если вы стремитесь к загадоч- 
ности и непрозрачности. Одновременно можно устанавливать несколько па- 
раметров. Их список приведен в разделе «Параметры настройки отладчика». 
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Настройка отладчика 


Способов настройки отладчика существует предостаточно, поэтому вам вряд ли 
потребуется модифицировать его. Находясь в самом отладчике, можно изменить 
его режим с помощью команды 0, из командной строки это можно сделать через 
переменную среды РЕВИГОВ_ОРТ$ и путем выполнения предварительно заданных ко- 
манд, хранимых в файлах гс. 


Поддержка отладки в редакторах 


Механизм журнала команд отладчика не позволяет производить редактирование 
в командной строке, как это делают многие интерпретаторы команд: нельзя из- 
влекать предыдущие строки с помощью ^р! или перемещаться к началу строки 
с помощью ^а2?, хотя можно выполнять предыдущие строки, используя синтаксис 
с восклицательным знаком, знакомый пользователям системного интерпретато 

ра команд. Однако если установить модули Тегпт::НЁеайкеу и Тегп::Веадііпе из СРАМ, 
можно получить полные возможности редактирования, аналогичные имеющим- 
ся в СМО-утилите геааііпе(8). 


Если у вас установлен етасз, можно организовать его взаимодействие с отладчи- 
ком Рей для создания интегрированной среды разработки, напоминающей инте- 
грацию етоасз с отладчиками С. В состав Ре! входит файл настройки, позволяю- 
щий модифицировать етасз так, чтобы он работал как структурный редактор, 
частично распознающий синтаксис Рег]. Этот файл находится в каталоге етасѕ 
дистрибутива исходного кода Ре!1. Пользователям ої следует также присмотреть- 
ся к т (и его мышино-оконной версии т), позволяющему выделять цветом 
ключевые слова Ре]. 


Существует также аналогичная по возможностям надстройка за авторством То- 
ма Кристиансена для взаимодействия с редактором оі любого крупного дистрибу- 
тива и оконной системой Х11. Надстройка действует аналогично интегрирован- 
ной многооконной среде, предоставляемой етасз, в которой отладчик управляет 
редактором. На момент написания данной книги оставалось неясным, войдет ли 
она в итоге в дистрибутив Рен. и где будет располагаться, но мы решили сооб- 
щить вам о такой возможности 


Настройка с помощью файлов инициализации 


Некоторые настройки можно произвести, внеся изменения в код файла инициали- 
зации .регіаЬ или рей ат: (имя файла зависит от операционной системы). Такой 
файл инициализации содержит код Рег], а не команды отладчика, и он обрабатыва- 
ется раньше, чем анализируется переменная среды РЕВЕОВ_ОРТ5. Например, можно 
следующим образом создавать псевдонимы, добавляя элементы в хеш #08: :а11аз: 


$а1іаѕ{1еп} = "5/71еп(. «)/р 1еподїһ($1)/' 
фа1іаѕ{510р} = ‘з/“^зтор (аї|іп)/0/`; 
$а11аз{рз} = '5/7р5\ю/р эса1аг /'; 
$а11а5{9011} = ‘5/7а01+(\5*)/ехії/`; 
$а]іаѕ{һе1р} = `5/^һе1р\ѕ*$/|һ/`; 


* Комбинация клавиш Сїгі-Р. — Прим. перев. 


2 Комбинация клавиш СЕ-А. – Прим. перев. 
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Используя внутренний АРІ отладчика, можно изменять параметры настройки 
вызовами функции в файле инициализации: 


рагѕе_ортіопз("№пЅї0ор=1 ІіпеІпғо=00.оџі АифоТгасе=1 Ёгапе=2"), 


Если в файле инициализации определена подпрограмма аѓїіегіпії, она будет вы- 
звана по окончании инициализации отладчика. Файл инициализации может на- 
ходиться в текущем или в домашнем каталоге. Поскольку он может содержать 
произвольные инструкции Рен, по соображениям безопасности его владельцем 
должен быть суперпользователь (гооё) или текущий пользователь, а запись в него 
должна быть разрешена только его владельцу. 


Если потребуется модифицировать отладчик, скопируйте ре 546.р] из библиоте- 
ки Регі под новым именем и делайте с ним все, что вашей душе угодно. При этом 
вам потребуется установить переменную среды РЕВІ50В примерно так: 


ВЕСТМ { гедиіге "турег15060.р1” } 


В крайнем случае переменную РЕЋІ50В можно также использовать для настройки 
отладчика, непосредственно устанавливая внутренние переменные или вызывая 
внутренние функции отладчика. Учтите, однако, что все переменные и функции, 
недокументированные здесь или вэлектронных страницах руководства ре 4евиз, 
рейдебяилз или ПВ, предназначены только для внутреннего употребления и могут 
быть изменены без предупреждения. 


Параметры настройки отладчика 


Отладчик имеет множество параметров настройки, которые можно установить 
с помощью команды 0 -— интерактивно, через переменные среды или файл ини- 
циализации. 


геса11Соттапа, зпе11Вапд 


Символы, используемые для повторного вызова команды или вызова систем- 
ного интерпретатора команд. По умолчанию тот и другой устанавливаются 
равными !. 
радег 

Программа, используемая для постраничного вывода в командах, начинаю- 
щихся символом |. По умолчанию используется $ЕМ\/{РАСЕВ}. Поскольку отлад- 
чик руководствуется текущими настройками терминала для вывода полужир- 
ного шрифта и воспроизведения эффекта подчеркивания, вывод результата 
работы некоторых команд отладчика через программу постраничного вывода 
может оказаться нечитаемым, если она не пропускает езсаре-последовательно- 
сти в неизменном виде. 


+КАиппіпо 
Запуск под управлением модуля ТК с выводом приглашения (посредством 
Веад1пе). 

ѕідпа1і еме1, магпіеуе1, дзеГеме1 


Уровень детализации сообщений. По умолчанию отладчик не касается обра- 
ботки исключительных ситуаций и предупреждений, поскольку их измене- 
ние может нарушить работу правильно выполняющихся программ. 
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Чтобы отключить этот безопасный режим по умолчанию, присвойте этим па: 
раметрам положительные значения. На уровне 1 можно отслеживать возник- 
новение всех предупреждений (это часто раздражает) или исключительных 
ситуаций (это часто ценно). К несчастью, отладчик не различает фатальные 
и нефатальные исключительные ситуации. Если 01е еуе1 имеет значение 1, не- 
фатальные исключительные ситуации тоже трассируются и бесцеремонно из- 
меняются, если возникают при выполнении е\а1 для ваших строк или в моду- 
лях, которые вы пытаетесь загрузить. Если 01е[1еуе1 имеет значение 2, отлад- 
чик не интересуется, откуда возникают исключительные ситуации: он захва- 
тывает право обработки исключительной ситуации и выводит трассировочную 
информацию, а затем модифицирует все исключительные ситуации, украшая 
их собственными деталями. Это, возможно, и полезно в некоторых задачах 
трассировки, но, скорее всего, безнадежно запутает любую программу, кото- 
рая серьезно относится к обработке исключений. 


Отладчик постарается вывести сообщение при поступлении неперехваченных 
сигналов ІМ, ВИ$ или 5ЕС\/. Если вы находитесь в медленном системном вызове 
(таком как маії, ассер* или геад, выполняя операцию с клавиатурой или соке- 
том) и не установили собственный обработчик сигналов $510{1\Т}, то не сможе- 
те вернуться в отладчик с помощью Сопёто[-С, поскольку обработчик сигнала 
$$16{1МТ} в отладчике не поймет, что должен возбудить исключительную си- 
туацию, чтобы выполнить [оп лтр(3) из медленного системного вызова. 


АитоТгасе 


Устанавливает режим трассировки (аналогично команде ї. но может распола- 
гаться в РЕНЕОВ_ОРТЗ). 


ііпеїп#о 


Назничает файл или конвейер для вывода сведений о номерах строк. Если это 
конвейер (например, |уіѕиа1_рег1_@0), используется короткое сообщение. Имен- 
но этот механизм применяется для взаимодействия с подчиненным редакто- 
ром или визуальным отладчиком – скажем, при использовании специальных 
обработчиков (ВооКз) для рі или етас$ или графического отладчика 44. 
іпћірії_ехії 
Значение 0 разрешает выход по окончании отладки программы. 
Ргіпінеї 


Если параметр установлен (по умолчанию - да), значение, возвращаемое ко- 
мандой г, выводится. 

огпатепіѕ 
Управляет внешним видом командной строки (см. электронную документа- 
цию по Тегпт::ВЁеадііпе). В настоящее время нет способа отключить украшения 
(огпатеп+ѕ), из-за чего вывод на некоторых мониторах или с некоторыми про- 
граммами постраничного просмотра бывает нечитаемым. Считается дефек- 
том программы. 

Тгате 
Управляет выводом сообщений при входе в подпрограммы и выходе из них. 
Если выражение Ггате & 2 ложно, сообщения выводятся только при входе. 
(Вывод при выходе может быть полезен, если он перемежается другими сооб- 
щениями.) 
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Если выражение Ггате & 4 истинно, выводятся аргументы функций вместе 
с данными о контексте и вызвавшей программе. Если истинно выражение 
Тгате & 8, для выводимых аргументов включаются перегруженная $1г1п01Ру 
и обработка функцией їіе ҒЕТСН. Если истинно выражение Ѓгапе & 16, выво- 
дится значение, возвращаемое подпрограммой. 


Максимальная длина списка аргументов при выводе определяется следую- 
щим параметром. 


пахТгасеіеп 


Максимальная длина списка аргументов при установленном бите 4! в пара- 
метре Ггапе. 


Следующие параметры управляют поведением команд \, Хи х: 
аггауреріћ, һаѕһрертһ 


Определяют максимальное количество элементов массива и хеша для вывода, 
соответственно. Если не определены, выводятся все элементы. 


сотрасЕВитр, мегуСсотрасї 


Определяют стиль вывода массивов и хешей. Если включен параметр соп- 
рас\битр, короткие массивы могут выводиться в одной строке. 


оЈорРгіпі 


Вывод содержимого таблицы типов данных ёуреғ1обѕ. 


ВитрОВЕ11е$ 


Вывод массивов, содержащих отлаживаемые файлы. 


ОбитрРаскадез 


Вывод таблиц символов пакетов. 


ритрВеиѕед 


Вывод содержимого «повторно используемых» адресов. 


диоте, Ні9АВІЕ, џпае#РгіпЕ 


Определяют стили вывода строк. Значением по умолчанию для диоїе является 
аито; можно установить формат с двойными или одинарными кавычками, за- 
писав в параметр или‘ соответственно. По умолчанию символы с установ- 
ленным старшим битом выводятся без цитирования. 


задебт1у 


Когда этот параметр включен, вместо содержимого переменных пакета выво- 
дятся элементарные дампы расходования памяти для каждого пакета на осно- 
вании суммарного размера строк, обнаруженных в переменных пакета. По- 
скольку используется таблица символов пакета, лексические переменные иг- 
норируются. 


Автоматическое выполнение 


В переменной $ЕМ\{РЕН.ОВ_ОРТЗ} можно определить начальные значения парамет- 


ров инициализации ТТҮ, поТТ\, Веадііпе и №п51ор. 


1 Здесь имеется в виду истинность выражения їгапе & 4, т.е. в действительности прове- 


ряется второй бит целого числа (отсчет начинается с нуля). – Прим. перев. 
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Если в файле инициализации содержится строка: 
рагзе_орт10п$( "№ оп5тор=1 і іпеїІ.Ёо=їрегі. ои АџїоТгасе"), 


программа работает без вмешательства пользователя, а данные трассировки по: 
мещаются в файл ірегі.оиі. (Если вы будете ее прерывать, следует задать для 
ііпеїлғо значение /дер/іѓу, если хотите что-то увидеть.) 


Следующие параметры можно задать только при запуске. В файле инициализа- 
ции их можно установить вызовом рагзе_ор\1оп3("ОРТЕУАЕ"). 


ТТУ 
Терминал, используемый для ввода/вывода при отладке. 
потту 


Если этот параметр установлен, отладчик входит в режим №п5Тор и не подклю- 
чается к терминалу. При прерывании (или явной передаче управления отлад- 
чику через установку переменных $08::5ідга1 или $08: :$1101е в программе Рен) 
отладчик подключается к терминалу, указанному при запуске в параметре Т'Ү 
или выбранному вами во время выполнения с помощью модуля Тегп: :Вепде7\уои$. 


В этом модуле должен быть реализован метод с именем пем, возвращающий 
объект с двумя методами: І\ и 007. Они должны возвращать дескрипторы фай- 
лов для использования отладчиком при вводе и выводе соответственно. Метод 
пем должен проверить аргумент, содержащий значение $ЕМ\{РЕВЕОВ_МОТТУ} при 
запуске, либо "ФЕМ{НОМЕ}/.рег10011у$$`. Этот файл не проверяется на правиль- 
ность владения им или защищенность от записи, поэтому теоретически суще- 
ствует угроза безопасности. 


Веадііпе 


Ложное значение отключает поддержку Аеаді іпе в отладчике, что позволяет 
отлаживать приложения, которые сами используют модуль Неад! іпе. 


М№оп5+ор 


Если этот параметр установлен, отладчик переходит в неинтерактивный ре- 
жим, пока не будет прерван или пока ваша программа не установит $08: :5іопа!) 
или $0В::51191е. 


Иногда параметры можно однозначно определить, обозначив их лишь первой бу- 
квой, но мы советуем всегда указывать их имена полностью для лучшей читаемо- 
сти и обеспечения совместимости в будущем. 


Вот пример использования переменной среды РЕНІ 08 0Р"5 для автоматической ус- 
тановки параметров. При этих значениях параметров программа запускается 
в неинтерактивном режиме с выводом информации о каждом входе в подпрограм- 
му и для каждой выполняемой строки. Выходные данные трассировки помеща- 
ются в файл ѓрегі.оиі. Это позволяет программе использовать обычные устройства 
ввода/вывода и избежать смешивания своих данных с данными трассировки. 


$ РЕВЬОВ_ОРТ$=”М№оп3 Фор Ғгате=1 АџоТгасе Е1пеТпРо={рег1. оси” рег1 -а тургод 


1 Здесь мы применили синтаксис интерпретатора команд $й для демонстрации установ- 
ки переменных среды. Пользователи других интерпретаторов должны внести соответ- 
ствующие изменения. 
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Если вы прервали выполнение программы, следует быстро установить 0 11пеТпРо= 
/деу/іту или другое устройство, существующее на вашей платформе, иначе вы не 
увидите приглашения отладчика. 


Подде ржка отладчика 


Рей предоставляет специальные функции для отладки на этапе компиляции 
и на этапе выполнения, чтобы создать такую же среду отладки, как для стандарт- 
ного отладчика. Эти функции не следует путать с ключами ре] -Р, которые мож- 
но использовать, только если Регі скомпилирован с ключом -РРЕВОССІМС. 


Например, при каждом обращении к встроенной функции сг Пег из пакета ОВ, аргу- 
менты, помещенные в соответствующий кадр стека, копируются в массив @ПВ::аг0з. 
При вызове Рен с ключом - включаются следующие дополнительные функции: 


• Рен вставляет перед первой строкой программы значение $ЕМ\/{РЕВЕ50В} (или 
ВЕСІМ {геди1ге ‘рег159.р1'}, если такой переменной нет). 


• В массив @{"_<$ЕПепапе“} помещаются строки $ѓі1епапе для всех файлоє, ском- 
пилированных Рег]. То же касается строк, выполняемых через еуа1 и содер- 
жащих подпрограммы, или выполняемых в данное время. Значения $#і1епапе 
для строк в е\а] имеют вид (е\а1 34). Утверждения в регулярных выражениях 
имеют вид (ге_еуа1 19). 


• В хеш %{" <$Ғі1епапе"} помещаются точки останова и действия. В качестве 
ключей выступают номера строк. Вместо целых хешей можно определять от- 
дельные элементы. Рей интересует здесь только логическая истинность, хотя 
значения, используемые регібаб.рі, имеют вид "$бгеак_сопаітіог\0$астіоп". Зна- 
чения в этом хеше имеют волшебное (та51с) свойство в числовом контексте: 
они равны нулю, если на строке нельзя создать точку останова. 


То же касается еуа]1-вычисляемых строк, в которых содержатся подпрограм- 
мы, или выполняемых в данный момент. Значения $! іепапе для строк, вы- 
полняемых через еуа1, имеют вид (еуа1 34) или (ге_еуа1 19). 


• Вскаляре ${”_<$11]епате"} содержится ` <$#і1епапе”. То же относится к еуа]1-вы- 
числяемым строкам, содержащим подпрограммы, или выполняемым в дан- 
ный момент. Значения $Гепате для строк, выполняемых через еуа1, имеют 
вид (еуа1 34) или (ге_еуа1 19). 


• После компиляции каждого файла, загружаемого через гедиіге, но до его вы- 
полнения, вызывается 0В::роѕіропей(*{" <$г1і1епапе"}), если существует подпро- 
грамма 1В::роѕїропеа. В данном случае $ѓі1епапе является расширенным име- 
нем файла в соответствии со значениями в %ІМС. 


» После компиляции всех подпрограмм зибпате проверяется $0В::роѕіропед{ѕир- 
папе}. Если такой ключ и подпрограмма 08: :роз{ропед существуют. выполняет- 
ся вызов 0В::роѕіропед(ѕирпате). 


» Поддерживается хеш %08::306, ключами которого являются имена подпро- 
грамм, а значения имеют вид Г/1]епате: таг 11пе-епо]1те. ѓіІепате имеет вид 
(еуаї 34) для подпрограмм, определенных внутри е\а1, или (ге_еуа1 19) для 
подпрограмм в утверждениях внутри регулярных выражений. 


• Когда выполнение программы доходит до места, где может содержаться точ- 
ка останова, вызывается подпрограмма 0В::08, если одна из переменных — 
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$08: :1гасе, $06::51п51е или $08::5ідпа1 — имеет истинное значение. Эти перемен- 
ные не локализуются. Эта функция выключается, когда выполнение происхо- 
дит внутри подпрограммы 0В::08, в том числе для вызываемых из нее функ- 
ций, если только выражение $^0 & (1<30) не является истинным. 


• Когда выполнение программы достигает точки вызова подпрограммы, вместо 
нее вызывается &08: :500(аг05), при этом $08::500 содержит имя вызываемой под- 
программы. Этого не происходит, если подпрограмма компилировалась в па- 
кете 0В. 


Обратите внимание: если для работы &08::5и0 требуются внешние данные, до ее 
завершения невозможен вызов каких-либо подпрограмм. Для стандартного от- 
ладчика пример такой зависимости дает переменная $08: :деер (на какое количест- 
во уровней рекурсии можно пройти вглубь отладчика до обязательного выхода). 


Создание собственного отладчика 


Минимальный работающий отладчик состоит из одной строки: 
ѕир ОВ: :0В {} 


которую, хотя она абсолютно ничего не делает, легко можно определить через пе- 
ременную среды РЕНІ 50В: 


$ РЕВІ5рВ="виб БВ: :0В {}” рег1 -@ усиг-ргодгат 
Другой компактный, но более полезный отладчик можно создать так: 
ѕир 08: :0В {ргапЕ ++$1; ѕса1аг <5Т0ІМ} 


Этот небольшой отладчик выводит порядковый номер каждой встретившейся 
инструкции и ждет нажатия клавиши Епїег для продолжения работы. 


Следующий отладчик, как ни мал он с виду, вполне функционален: 


{ 
раскаде 0В; 
зир ОВ {} 
взир зиб {ргіпі ++$1. $500\п` &$$40} 


} 


Он выводит порядковый номер вызова подпрограммы, а также ее вызываемой 
подпрограммы. Заметьте, что 808::546 должна компилироваться в пакете 08. как 
мы здесь это сделали. 


Если базой для вашего нового отладчика является текущий отладчик, существу- 
ет несколько обработчиков, которые помогут его настроить. При запуске отлад- 
чик читает файл начальной конфигурации из текущего каталога или домашнего 
каталога. После чтения файла отладчик читает переменную среды РЕНЕОВ_ОРТ$ 
и выполняет ее анализ как остатка строки 0 ..., которая могла быть введена в от- 
вет на приглашение отладчика. 


Отладчик поддерживает также «волшебные» внутренние переменные, такие 
как 6@08::9611пе, %08::0611пе, служащие псевдонимами для 6©{“ : <сиггепі #і1е") 
%{":: <сиггепі ?11е`}. Здесь сиггепі ҒіІе является файлом, выбранным в данный 
момент либо явно с помощью команды отладчика +, либо неявно в соответствии 
с логикой выполнения программы. 
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Настройку облегчают некоторые функции. 1В::рагѕе_орііопѕ(57АІМС) выполняет 
анализ строки как параметра команды 0. ОВ: :дитр_1гасе(5КТР [,СОУМТ]) пропускает 
заданное количество кадров стека и возвращает список, содержащий сведения об 
указанном количестве кадров стека вызова (или обо всех кадрах, если СОИМТ от- 
сутствует). Каждый элемент списка является ссылкой на хеш с ключами "сопіехі" 
(., $ или 6), "зиб" (имя подпрограммы или сведения ое\уа1), “агдз" (ипде* или ссылка 
на массив), "ѓііе" и “пе”. Функция ПВ: :ргап{_1гасе(ЕН, 5КІР [,СОимт [, 5НОВТ1]) вы- 
водит в форматированном виде сведения о кадрах стека вызовов в заданный фай- 
ловый дескриптор. Две последние функции удобно использовать как аргументы 
команд отладчика < и <<. 


Нет необходимости все это заучивать. На деле, когда требуется отладить про- 
грамму, мы обычно добавляем в код некоторое количество команд вывода и по- 
вторно прогоняем программу. 


А на пике формы мы еще вспоминаем, что хорошо бы включить вывод предупре- 
ждений. Этого часто оказывается достаточно, чтобы обнаружить проблему и не 
рвать на голове волосы (или то, что от них осталось). Однако если этого недоста- 
точно, приятно сознавать, что за ключом -4 в терпеливом ожидании находится 
чудный отладчик, который может сделать почти все, кроме того, чтобы найти за 
вас ошибку. 


Самое важное, что следует запомнить о настройке отладчика, это, пожалуй, сле- 
дующее: не ограничивайте свое представление о программных ошибках (653) 
как о чем-то, что приводит Рез] в расстройство. Если программа приводит в рас- 
стройство вас, это тоже ошибка. Выше мы показали пару очень простых мользо- 
вательских отладчиков. В следующем разделе мы рассмотрим пользовательский 
отладчик иного сорта, который (бывает) в состоянии помочь отладить ошибку под 
названием «Эта штука собирается когда-нибудь закончить работу?». 


Профилировщик Реп 


На момент написания этих строк в состав Рег! входил профилировщик с названи- 
ем реуе1::рРго?. Однако, когда вы будете читать эти строки, возможно, он уже ка- 
нет в Лету. Версия Рег у5.16, которая должна выйти, когда эта книга окажется 
на полках книжных магазинов, уже не будет включать этот старый профилиров- 
щик. Большинство пользователей профилировщиков перейдет на другой инстру- 
мент, 0е\уе] ::МУТРго®, Мы расскажем вам о профилировщике 0ехе1::ВРго?, посколь- 
ку он пока еще входит в состав Реп, но мы также расскажем и о новом профили- 
ровщике, который пока отсутствует в Рег]. 


Эти профилировщики достаточно тяжеловесны, но помимо них существуют 
и другие. В архиве СРАМ доступен также профилировщик 0е\уе]1::5та1 1Ргоф, сооб- 
щающий о времени, потраченном на исполнение каждой строки программы. Он 
поможет выявить использование дорогостоящих (в смысле времени выполнения) 
конструкций Ре]. Большинство встроенных функций отличается высокой эф- 
фективностью, но очень легко написать регулярное выражение, время выполне- 
ния которого увеличивается в геометрической прогрессии с увеличением объема 
входных данных. См. также раздел «Эффективность» в главе 21, где приводятся 
дополнительные советы. 
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Оеме!::ОРго{ 


Хотите, чтобы ваша программа работала быстрее? Ну, конечно, да. Но прежде 
следует спросить себя: «Действительно ли нужно тратить время, чтобы заставить 
программу работать быстрее?» Оптимизация на досуге может доставлять удо- 
вольствие,! но обычно есть более привлекательные способы провести время. Ино- 
гда следует заранее составить план и запустить программу во время перерыва на 
кофе (или использовать запуск в качестве повода для перерыва на кофе.) Но если 
действительно требуется, чтобы ваша программа работала быстрее, начать следу- 
ет с ее профилирования. Профилировщик может сообщить, какие участки про- 
граммы дольше всего выполняются, чтобы вам не пришлось терять время, совер- 
шенствуя подпрограмму, оказывающую незначительное влияние на общее время 
выполнения. 


В состав Рей входит профилировщик 0е\е1::ОРгоГ. Его можно использовать для 
профилирования программы Ре] в тусоде.рі, введя: 


х рег1 -а:ОРго{ пусобде. р1 


Хотя мы и назвали ОРгоГ профилировщиком, поскольку именно в этом состоит его 
функция, в нем используется тот же самый механизм, который мы обсуждали 
ранее в этой главе. ОРгоѓ является просто отладчиком, регистрирующим моменты 
времени, когда Ре! вошел или вышел из каждой подпрограммы. 


Когда профилируемый сценарий завершается, ОРгоѓ сохраняет дамп с информа- 
цией о хронометраже в файле с именем #топ.оиф. Программа арго}{рр, поставляе- 
мая с Рем, умеет анализировать ѓтоп.оиїѓ и создавать отчет. Программу арго{рр 
можно также использовать как внешний интерфейс для процесса в целом с помо- 
щью ключа -р, описываемого далее. 


Пусть имеется такая программа: 


оиїег(); 


зир оцїег { 
Рог (пу $1=0; $1 < 100; $1++) { 1ппег 


зуб іппег { 
пу $Тота1 = 0; 
Ғог (ту $1=0; $1 < 1000; $1++) { $їоїа1 += $1 } 


іппег(); 
аргоўрр может вывести следующую информацию: 


0.537654 Ѕесопӣѕ 
0.317552 Ѕесопаѕ 


Тофа1 Е1арѕед Гіте 
Џѕег+буѕтет Тіпе 
Ехс1и$1уе Тітеѕ 
%Тіте Ехс1Зес Сити1$ #Са11$ ѕес/са11 Сзес/с Мате 
85.0 0.270 0.269 101 0.0027 0.0027 паіп: : 1ппет 
2.83 0.009 0.279 1 0.0094 0.2788 таіп: :оитег 


1 По крайней мере, так считает Натан Торкингтон, который написал этот раздел книги. 
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Обратите внимание, что сумма процентов не равна 100. Более того, в нашем слу- 
чае она довольно далека от этого значения, и это должно послужить подсказкой, 
что программу следует погонять подольше. Общее правило заключается в сле- 
дующем: чем больше данных профилирования можно собрать, тем лучше стати- 
стическая выборка. Если увеличить число проходоь внешнего цикла со 100 до 
1000, результаты получатся более точными: 


Тота1 Е1арѕед Тлме = 2.875946 Ѕесопӣѕ 
Џѕег+Ѕуѕтет Т1те = 2.855946 5есопа$ 

Ехс10ѕіме Тітеѕ 

Тіпе Ехс15ес Оитџи15 #Са113 ѕес/са11 Сзес/с мате 
99.3 2 838 2.834 1001 0.0028 0.0028 таїп: :іппег 
0.14 0.004 2.828 1 0.0040 2.8280 таіп: : оиег 


В первой строке сообщается, сколько времени выполнялась программа от начала 
и до конца. Во второй строке выводятся два числа: время, потраченное на выпол- 
нение пользовательского кода («изег»), и время, потраченное операционной систе- 
мой на выполнение системных вызовов, осуществляемых из вашей программы 
(«зузбешт»). (Не будем обращать внимания на ложную высокую точность пред- 
ставления этих чисел: генератор тактовых импульсов компьютера наверняка не 
отмечает миллионные доли секунды, в лучшем случае – сотые.) 


Время «цѕег+ѕузіет» можно изменить с помощью параметров командной строки 
аргоїрр. Ключ -г осуществляет вывод истекшего времени, -$ — только системного 
и -и – только времени пользователя. 


Остальная часть отчета содержит распределение времени по подпрограммам. 
Строка «Ехсіџѕіуе Тітеѕ» означает, что, когда подпрограмма оџїег вызывала под- 
программу іппег, время, затраченное в іппег, не включалось во время, потрачен- 
ное в оџїег. Чтобы изменить этот режим и суммировать показатели 1ппег и оитег, 
передайте арго]рр ключ -Г. 

Для каждой подпрограммы сообщаются следующие значения: %Тіпе – время 
в процентах, потраченное внутри этой подпрограммы; Ехс15ес — время в секун- 
дах, потраченное в этой подпрограмме, исключая время работы вызванных из нее 
подпрограмм; Сити1$ — время в секундах, потраченное в этой подпрограмме и вы- 
званных из нее подпрограммах; #Са115 – число вызовов подпрограммы; 3ес/са11 — 
среднее время в секундах каждого вызова подпрограммы, не включая время ра- 
боты подпрограмм, вызванных из нее; Сзес/с — среднее время в секундах каждого 
вызова подпрограммы вместе с работой подпрограмм, вызванных из нее. 


Наиболее полезной из этих характеристик является %Т1те, которая показывает, 
куда уходит время. В нашем случае большую часть времени занимает процедура 
іппег, поэтому следует попытаться оптимизировать ее или придумать алгоритм, 
при котором она вызывалась бы реже. :-) Ключи дргоўрр предоставляют доступ 
к другим данным или изменяют способ подсчета времени. Можно также заста- 
вить аргоўрр сначала запустить сценарий, поэтому помнить ключ -4:Орго} не обя- 
зательно: 


-р $СШРТ 


Сообщает арго{рр о необходимости профилировать указанный сценарий 5СИ1РТ, 
а затем интерпретировать данные профилирования. См. также -©. 


-@ Используется вместе с -р, чтобы заставить арго{рр завершить работу после 
выполнения профилирования без интерпретации данных. 
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-а Сортировать выводимую информацию в алфавитном порядке по именам под: 
программ, а не по убыванию доли времени. 


-В Вести отдельный учет по анонимным процедурам, определенным в том же 
пакете. По умолчанию все анонимные процедуры учитываются как одна 
с именем та1п::__АМ№М№__. 


-І Вывести время работы всех подпрограмм с учетом времени работы вложен- 
ных вызовов подпрограмм. 


-1 Сортировать по количеству обращений к подпрограмме. Может помочь опре- 
делить кандидатов на подстановку (іпіпіпе). 


-О СОимТ 
Показать только первые С00МТ подпрограмм. По умолчанию равно 15. 
-9 Не выводить заголовки колонок. 


-Т Вывести на стандартное устройство вывода дерево вызова подпрограмм. Ста- 
тистические данные по подпрограммам не выводятся. 


-# Вывести на стандартное устройство вывода дерево вызова подпрограмм. Ста- 
тистические данные по подпрограммам не выводятся. Функция, вызванная 
несколько раз (последовательно) на одном уровне вызова, выводится один раз 
с указанием счетчика обращений. 


-$ Структурировать вывод согласно порядку вызова подпрограмм: 


мази: :іппег х 1 0. 008$ 
паіп: :оиег х 1 0.4675 = (0.000 + 0. 468)5 
таіп: :іппег х 100 0. 4685 


Это нужно понимать так: с верхнего уровня программы 1ппег была вызвана 
один раз и работала 0,008 с, с верхнего уровня программы ощег была вызва- 
на один раз и работала 0,467 с, с учетом времени, затраченного во вложенных 
вызовах подпрограмм (0 с в самой оцїег и 0,468 с в подпрограммах, вызван- 
ных из ои{ег), выполнив іппег (которая работала 0,468 с) 100 раз. Ну как, все 
понятно? 


Ветви на одном и том же уровне (например, один раз вызвана 1ппег и один раз 
вызвана оџїег) сортируются по суммарному времени. 


-(_ Не сортировать. Выводить согласно порядку обнаружения в исходных дан- 
ных профилирования. 


-р2 Сортировать по среднему времени нахождения в подпрограмме для всех вы- 
зовов. Иногда помогает выявить кандидатов нг оптимизацию вручную путем 
подстановки (іпіпіпе) тел подпрограмм. 


-& ѕибгоиТіпе 
Игнорировать подпрограммы, исключая 5иогоитлпте и вызовы из нее. 


Прочие параметры описаны в арго{рр(1), стандартной странице руководства по 
этой программе. 


Ре\ме!::МУТРго{ 


Разработку модуля Пехе1::№ҮТРго? начал Адам Каплан (Айат Карап) в №еш УогЁ 
Тітез, но в настоящее время разработка этого модуля ведется за стенами Тітеѕ. 
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Это быстрый (написан на С) и мощный профилировщик, способный выводить 
прекрасно отформатированные отчеты. И это самый быстрый профилировщик 
инструкций и подпрограмм из доступных на сегодняшний день, однако в книге 
не так много места, чтобы можно было рассказать обо всех его замечательных 
возможностях. Загрузите его из архива СРАМ и попробуйте использовать, как 
любой другой отладчик: 


Х рег! -9: МУТРго? уоиг_ргодгат 


После завершения можно исследовать полученные результаты, которые сохраня- 
ются в формате НТМГ.. Первый НТМГ-файл (рис. 18.1) содержит сводную инфор- 
мацию: 


%Х пуїрготћіт1 --ореп 


С помощью переменной среды МУТРЕОЕ можно определить самые разнообразные 
настройки профилировщика. Например, можно сообщить ему, когда следует на- 
чинать хронометраж: немедленно, на этапе ТМТ или в начале ЕМ№: 


$ епу МҮТРВОЕ=$+агі=іпії рег1 0: МҮТРгоҒ усуг_ргодгат 
Дополнительную информацию вы найдетє в документации модуля. А теперь сде- 


лаем перерыв на чашечку кофе. Это совершенно необходимо, прежде чем присту- 
пать к следующей главе. 


Ре{огтапсе Ргоћіе Іпаех рр рер 


Бог оо ежа -а Ҹат г оп Бип Осі 23 21:09:25 2011 


Ргоће ої ќ0015/роб2досбоск їог 27.95 (0# 38.25), ехесийпд 928955 51аіегтепїѕ апо 3270739 ѕиргоибпе саіїѕ іп 74 
ѕошсе евала 17 5тпд еуа5 


јитр то Не. 


Тор 15 биогоиопез 
байв Р [ЕР ТЕхсїивіче Ппошама Зибесилное 
| тіте Тме Е 
539364 9 1 2.145 2.145 э 
127890 21 1 1.755 4.095 
2982 1 1 1.525 25.25 
49937 1 1 1.175 5.495 
9582 11 1.175 2085 за со 
36133 21 1.175 1.785 
154912 16 1 1115 1.726 
327281 13 2 1055 1.055 ч 
136126 15 1 1.015 1 535 .с1еаг рай 
156 6 1 952тѕ= 952т$ :СОЗЕ:а"Ьнъ 
‚ 93529 73 1 786бтз 4.845 ‘ада иші баа 
34251 2 2 774тз 15.85 :_ткамегве бгее1єё п. 
59356 1 1 680т5 1.955 ‚десоде 
26 11 6315 26.05 :рагве_#11е 
442498 29 1 61975 671т5 :СОВЕ: вые 


Зее ан 1.21 Бит 


уси сап мем а пеегтар о! зиргоувие ехсшѕме уте, дгоиред ру раскаде. 
МҮТРгоғ аіѕо депегаез сајі-дғарћ Кеѕ іп СгарН\2 іогтаї: имег-раскаае са!іѕ, а! іпег-5убгоџћпе са! (ргобаыу зоо 
сотріех їо гепаег өаѕіу). 


Рис. 18.1. Начальная страница в формате НТМІ с результатами работы МҮТРгоў 
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СРАМ 


Изначально СРАМ служил репозиторием программного обеспечения на языке 
Рег], но с тех пор превратился в коллекцию разноплановых служб, построенных 
на базе репозитория. Когда люди говорят «СРАМ», они могут подразумевать лю- 
бую из этих служб, так как люди склонны соотносить с этим названием все, что 
связано с центральным репозиторием. 


История 


Где-то в конце 1993 года Тим Банс (Тіт Випсе), Яркко Хиетаниеми (ЈагкКо Ніеќѓа- 
піеті) и Андреас Кениг (Апӣгеаѕ Кӧпіғ) создали список рассылки регі-раскгаіѕ 
для обсуждения идеи создания единого архива программного обеспечения, напи- 
санного на Рег! 4 и разбросанного по Интернету. В этом же году была запущена 
разработка версии Рег] 5, одной из основных особенностей которой должна была 
стать расширяемая система модулей, позволяющая развивать возможности язы- 
ка, не изменяя регі. Джаред Райн (Јагеа Кһіпе) предложил идею централизован- 
ного репозитория, но она не нашла отклика. Его идея была основана на опыте 
СТАМ (Впр://шило.сап.оге), Сотргећепѕіуе ТеХ. Атсшуе МебмогК (архив Тех). 


Пару лет спустя Яркко вернулся к этой идее и создал ЕТР-архив с адресом {ёр:// 
р.срап.огя. Вскоре после этого Андреас Кениг (Апагеаз Кбп1=) создал РАОБЕ 
(ћё1р://раиѕе.регі.оге), Рей Ачіћогѕ Оріоаа Бегуег, дающий людям возможность 
передавать свои наработки в этот репозиторий. То, что многие подразумевают под 
названием «СРАМ», в действительности является всего лишь двумя каталогами, 
которые СРАМ зеркалирует с сервера РАОБЕ. Однако СРАМ - это намного более 
обширная сущность. 

Службы главного сервера СРАМ зеркалируются множеством серверов для обеспе- 


чения быстрого доступа из любой точки мира. В настоящее время насчитывается 
порядка 300 общедоступных зеркал, размещенных на всех шести континентах. 
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Любой желающий может создать новое общедоступное или даже частное, для 
собственных нужд, зеркало СРАМ.1 


По мере роста популярности СРАМ архив стал обрастать другими проектами. 
Грэм Барр (СгаБат Вагг) добавил интерфейс поиска #Нр://зеагсй.срап.оге. Барби 
(ВагЫе) воплотил идею СРАМ“ Тезфегз для организации тестирования каждого ди- 
стрибутива в СРАМ. Дэвид Кантрелл (Рау1А Сапіте]) разработал СРАМ4ерз для 
объединения результатов тестирования дистрибутивов со всеми их зависимостя- 
ми. Мориц Онкен (Мог! 2 ОпКеп) создал поисковый сайт второго поколения на ос- 
нове проекта МеаСРАМ (ВИр5://шши.теасрап.ог=), являющегося частью проек- 
та @оое Битшег оѓ Соде. 


Вокруг собственно архива СРАМ, являющегося всего лишь центральным репози- 
торием. сосредоточено множество других служб. 


Обзор репозитория 


Большинство файлов, имеющихся в СРАМ, попали туда с сервера РАОЅЕ, содер- 
жащего каталоги аи ог: и тойиіеѕ. Помимо каталога с модулями, в СРАМ хра- 
нится масса другой информации, и ниже вашему вниманию предлагается экс- 
курс по наиболее интересным разделам архива. 


аиіћогѕ (ВИр:// ши. срап.ота/аи4йогз) 


Этот каталог является зеркалом РАОБЕ и содержит огромное количество подка- 
талогов, упорядоченных по идентификаторам авторов, хранящимся в подката- 
логе іа (Вир://иило.срап.огЕ/аийотз Ла). На верхнем уровне в качестве имен ката- 
логов выступают начальные буквы идентификаторов авторов, на втором уров- 
не – пары начальных букв, и на последнем уровне — полные идентификаторы. 
Например, для автора МАМІ (Ѕіпап Опбу) путь к его каталогу имеет вид {4/М№/ 
МА/МАМТЬ. В этом каталоге находится все, что выгрузил и не удалил Ѕіпап 
(удаленные файлы можно найти на сайте ВасКРАМ: АИр://БасЁрап.рет.огЕ). 


У некоторых авторов имена каталогов соответствуют полным именам авторов; 
например, Ниво орип Ӣег Ѕапаӣеп. Ранее, когда авторов было не так много, ка- 
талог аиіћогѕ имел более плоскую структуру. С ростом популярности СРАМ 
количество зарегистрированных авторов превысило 9000, и теперь каталог 
РАОБЕ разбивает имена авторов в трехуровневую структуру. 


4ос 


В этом каталоге хранится документация по Ре!|, а также масса различных 
комментариев к этой документации, но он более не поддерживается официаль- 
но. В нем можно найти довольно интересные материалы, но в настоящее время 
он не является основным источником информации о языке Рей. Основную 
электронную документацию по Рет] см. на сайте ћіїр://регіос.регі.оге, а допол- 
нительную документацию с описанием модулей - на сайтах модулей. 


тоаиіеѕ 


Любопытно, но модули хранятся не здесь. Данный каталог содержит специаль- 
ные индексные файлы, которые позволяют клиентам СРАМ преобразовывать 


1 См. статью «Ноу ёо тіггог СРАМ» (как создать зеркало СРАМ) по адресу №Ёр://шиль. 


срап.оге/тіѕс/Һош-10-тігғоғ.Рті. 
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имя пакета, такое как Мојо1ісіоџѕ, в путь к файлу в каталоге аи йогз, в данном 
случае – к файлу аи#ог5/14/5/5К/З5ЕТ/Моройс<1оиз-1.994аг.вг (возможно к дру- 
гому, в зависимости от номера последней версии Мојо1ісіооѕ). 

Здесь также существуют подкаталоги, такие как Ру-тойиіе, обеспечивающие 
организацию по именам модулей, а не по идентификаторам авторов. Элементы 
в этом каталоге являются символическими ссылками, уходящими вглубь ка- 
талога аиіћогѕ, где находятся фактические файлы. 


Кроме того, имеется каталог бу-саёевогу, не особенно полезный в наши дни. До 
появления в СРАМ многих тысяч дистрибутивов архивариусы СРАМ стреми- 
лись отнести каждый модуль к той или иной категории, благодаря чему име- 
лась возможность навигации по категориям! в поисках требуемого модуля. 
Прямой поиск оказался более популярным, чем блуждание по виртуальным 
стеллажам СРАМ, поэтому раздел «Мойше 1154» со списком модулей очень бы- 
стро потерял свой глянец и пришел в упадок. Задумка была отчасти в том, 
чтобы авторы сами регистрировали дистрибутивы и относили их к уместным 
категориям в РАОБЕ, но мало кто теперь так поступает. 

рогіѕ 
Этот казалог содержит исходный код и в некоторых случаях готовые исполня- 
емые образы Регі для платформ, которые не поддерживаются непосредственно 
стандартным дистрибутивом или для которых известную трудность составля- 
ет получение компилятора. Эти портированные версии языкғ являются собст- 
венными проектами авторов и не всегда работают точно так, как описано 
в этой книге. В настоящее время мало какой системе требуется особая сборка 
Ре]. Указатель в этом каталоге в любом случае представляет интерес, по- 
скольку содержит сведения о том, с какого момента времени тот или иной про- 
изводитель операционных систем начал включать Реп в поставку своей ОС. 

зсгіріѕ 
Этот каталог содержит небольшую коллекцию разнообразных программ на 
Рей. В значительной степени он является пережитком времен, когда люди 
распространяли уже готовые программы. Авторы включали свои программы 
в раздел 8сгіріѕ, добавляя в них специальные заголовки с описанием. Увы, 
в настоящее время этого почти никто не делает. Теперь авторы предпочитают 
выгружать готовые программы в составе своих модулей для Рей, обычно 
в пространстве имен Арр::. Архив СРАМ не очень хорошо подходит для распро- 
странения сценариев, он в большей степени ориентирован на модули. 

тс 
В этом каталоге вы найдете исходный код для стандартного дистрибутива 
Реп. Точнее, для двух стандартных дистрибутивов Рег]. Один из них помечен 
как тат (поддерживаемый), а другой как 4ео@ (разрабатываемый). Обычно 
разработка Рей делится на две ветви. Первая, таіпі, предназначена для ис- 
пользования в промышленном окружении. Ветвь дере! – экспериментальная, 
в ней разработчики опробуют новые особенности, новый код и многое другое, 
что пока не отличается стабильностью в работе. 


Чтобы отличить одно от другого, взгляните на номер версии, такой как 5.14.2. 
Первое число — это старший номер версии, подразумевает Рен у5. Второе чис- 


' Помнитли кто-нибудь, как выглядел Үаһоо! до взрыва популярности поиска? 
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ло – младший номер версии.! Если младший номер является четным числом — 
это поддерживаемая версия. То есть, дистрибутивы с номерами версий 5.10.1, 
5.12.4 и 5.14.2 являются стабильными версиями, поскольку 10, 12 и 14 чет- 
ные числа. Если младший номер версии является нечетным числом, как в вер- 
сии 5.15.3, — это экспериментальная версия, поскольку 15 -- число нечетное. 


В этом каталоге всегда есть две ссылки на самые последние версии обеих ве- 
ток. Ссылки Іаѓеѕілағ.ьг (иИр://шил.срап.огв/зтсЛелеялаг.зг) и таіпілаг.в2 
(ћ21р://рило.срап.ога/ѕгс/таіпілаг.&2) указывают на самую последнюю версию 
и на самую свежую поддерживаемую версию соответственно?. Специалисты, 
осуществляющие сопровождение СРАМ, не приветствуют использование этой 
терминологии, потому что многие не понимают заложенного в нее смысла. 


Создание собственного мини-зеркала СРАМ 


Любой желающий может создать собственное зеркало СРАМ, но вы должны по- 
нимать, что при этом вам придется синхронизировать 24000 дистрибутивов, за- 
нимающих порядка 13 Гбайт дискового пространства (на момент написания этих 
строк). Поскольку репозиторий РАОБЕ индексирует только последние дистрибу- 
тивы, большая часть архива вам, вероятно, не потребуется. В большинстве слу- 
чаев достаточно хранить только самые последние версии. Учитывая все это, 
в 2002 году Рэндал Шварц (Вапда1 Ѕсһмагіз) создал программу тілісрап и напи- 
сал об этом в журнале «Ііпих Маразғіпе».? Ему удалось уменьшить объем своего 
локального зеркала СРАМ“ на 80%, из-за чего брайан д фой (ђгіап а ѓоу) ввел тер- 
мин «коэффициент Шварца», определяющий это отношение. 


Все необходимые инструменты содержатся в дистрибутиве СРАМ№::Мпі. Этот мо- 
дуль не является частью стандартной библиотеки, поэтому его придется устано- 
вить вручную (процесс описан далее в этой главе). 


Сначала необходимо выполнить настройки, указав, откуда будут извлекаться но- 
вые данные и где они будут сохраняться: 


10са1: //зегз/Ате11а/МТАТСРАМ 
гетоте: ВЕЕр://срап. ехатр1е. соту 


Запустите программу типісрап, чтобы создать тонкий срез репозитория: 


% тіпісрап 

Џѕіпо соп?ід Ғгот /Џѕегѕ/Ате11а/. тіпісрапгс 
Џрдаїіпд /Озеге/Атеї іа /МІМІСРАМ№ 

Міггогіпо Ёгот һр: //срап. ехапр1е. сот/ 


аитћогѕ/О1таі1гс.їхі. 92 ... ирдафед 
тойџ1е5/02раскадеѕ. 9е\а11$. хі. 92 .. ирдатед 
птойџ1е5/03т001151. даа. 972 .. ирдаїеа 


1 Младший – не значит «незначительный». Изменение этого числа отмечает выпуски 
значительных версий. Вообще говоря, первое число в номере версии следует интерпре- 
тировать как «для Регі5», а следующее число – как старший номер версии. 


2 Официально разработчики Рей поддерживают две последние версии. Если текущей 
версией является Рег] у5.16, это означает, что версия у5.14 также официально поддер- 
живается, а версия у5.12 - нет. См. подробности на страницах регіроіісу. 


з ріїр://илош.ѕіопеһепве.сот/тегіуп/іпихМав/соі42.№ті. 
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аиспогх/іа/А/АА/ААВ/Матћ-С1іррег-1.01.1аг. 92 . ирбаѓей 
аџиїћогѕ/іа/А/АА/ААВ/СНЕСКЅ0МЅ .. ирдатед 


Настройте клиентов СРАМ на использование этого репозитория, и после этого вы 
получите возможность устанавливать модули, даже находясь в поезде, самолете 
или автомобиле, посреди пустыни Блэк-Рок (Віаск Коск Юеѕегі) и даже там, где 
нет электричества. Ну... пока остается заряд в аккумуляторах. 


Вы можете с большой степенью точности управлять содержимым своего репози- 
тория, однако для этого придется написать собственную программу тілісрап, 
реализующую необходимое управление. Функции тойџ1е_ѓі1їегѕ и раїћ_#і11егѕ 
позволяют использовать регулярные выражения или ссылки на подпрограммы, 
определяющие, какие модули или каких авторов следует пропустить. Если по- 
пытка сопоставления с шаблоном или вызов подпрограммы возвращает истинное 
значение, модуль СРАК: :М1п1 пропускает такой дистрибутив: 


џѕе СРАМ: :М1пі1; 


СРАМ: :Міпі->ирдате ті ггог( 


гетоте => “НЕТр: //срап. т1ггогѕ. сот пїегп. зи”, 
]оса1 => “/изг/зпаге/т1ггогз/срап”, 
Ғогсе => 0, 


тойџ1е_Ғі1їегѕ => [ аг/Асте/1 ], 
раїһ_#і1їегѕ => [ 
аг/ВЈВ/, 
зир { $ [0] =- /50№00/ } 
1, 
); 
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Архив СРАМ в действительности является комплексом служб, стоящих между 
теми, кто выгружает дистрибутивы, и теми, кто устанавливает их. В этой главе 
мы не будем детально рассматривать все службы, а просто познакомимся с самы- 
ми основными элементами. 


РАОЅЕ 


РАОЅЕ (ћг1р://раиѕе.регі.огв) – это вход в архив СРАМ для авторов. Прежде чем что- 
либо опубликовать, необходимо зарегистрироваться. Делается это легко и просто. 
Один из администраторов РАОЗЕ проверит ваш запрос, только чтобы убедиться, 
что вы не бот, и затем настроит учетную запись. 


Получив учетную запись, вы сможете помещать свои файлы в репозиторий РАХЕ. 
Публиковать можно все, что заблагорассудится. РАОБЕ никак не интересуется 
тем, что вы делаете или как вы это делаете. 


Когда вы публикуете свой дистрибутив, программа индексирования репозитория 
РАОВБЕ исследует ваш архив на наличие пространств имен Реп. На использова- 
ние пространств имен нет никаких ограничений, но в РАОБЕ хранится список 
лиц, которые уполномочены изменять те или иные пространстве имен. 


• Первый, кто использовал некоторое пространство имен. получает статус пер- 
вооткрывателя и становится основным хранителем (ргітагу таіпіаіпег). 
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• Основной хранитель может выдавать права сохранителей (со-таіпіаіпег) 
другим авторам. 


• Основной хранитель может передать свой статус другому автору. 


Если публикуемый вами дистрибутив использует пространство имен, изменять 
которое вы не уполномочены, программа индексирования РАОЗЕ откажется ин- 
дексировать модуль и отправит вам сообщение об ошибке. При этом ваш дистри- 
бутив будет сохранен и останется доступным в СРАМ. Люди смогут загружать 
его. Но, не будучи проиндексирован, дистрибутив не попадет в базу данных 
РАОБЕ. Если ваш дистрибутив не появится в базе данных, клиенты СРАМ не уз- 
нают оего существовании и не смогут установить его. Репозиторий РАОЗЕ просто 
не заметит ваш дистрибутив, как и весь остальной мир. 


Пользователь 


СРАМ, 
| зеагси | 


| [маасРАм | 
СРАМдерѕ зеркало 


зеркало зеркало 


Рис. 19.1. Карта экосистемы СРАМ 


Поиск в СРАМ 


Существует два основных сайта, осуществляющих поиск в архиве СРАМ, и оба пре- 
доставляют аналогичные возможности. Каждый дополнительно служит для хра- 
нения специфических для каждого дистрибутива ссылок на другие проекты СРАМ: 


• СРАМ“ беагсһ (лѓір://ѕеагсһ.срап.огЕ) 
• МетаСРАМ (л71рѕ://оииш.теіасрап.ога) 
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Тестирование 


В Рей поддерживается высокая культура тестирования. Как только кто-то опуб- 
ликовал новый дистрибутив в репозитории РАОБЕ, свободная конфедерация ма: 
шин разных форм и размеров, известная как СРАМ Теѕіегѕ (ћіїр://еѕзѓеге.срап.оге), 
загружает, собирает и выполняет прогон тестовых наборов этого дистрибутива. 
Данная группа старается проверить как можно большее число модулей на как 
можно большем числе платформ и вариантов Рег]. 


Благодаря этому автор может вести разработку на одной платформе, а выгрузив 
свои наработки, получить результаты тестирования на других платформах и с раз- 
ными версиями Рен. И все это бесплатно! Получить подробные инструкции по соз- 
данию дистрибутивов, «дружественных для проекта Теѕіегѕ», можно на вики- 
странице СРАМ Тезтег$ (№Ир://ил Е. сраплезфегз.огв). 


Результаты тестирования доступны также пользователям модулей из СРАМ. Лю- 
бой желающий может исследовать отчеты с результатами тестировании и уви- 
деть, как чувствует себя модуль. Проект СРАМдерз (АНр://дерз.сратезегз.ог8) 
Дэвида Кантрелла (рауій Сагёге!]) предоставляет отчеты с результатами тестиро- 
вания в табличной форме с перечислением платформ и версий Регі, а также по- 
зволяет получить сводную информацию для всех зависимостей модуля, в качест- 
ве меры «вероятности успеха» установки. 


Отслеживание ошибок 


Поскольку Ре! и СРАМ не являются единым централизованным проектом, суще- 
ствует множество мест, где можно оставлять отчеты об ошибках или изучать их. 
Однако многие сообщают об ошибках в частной форме, направляя персональные 
электронные письма, т.е. не создавая общедоступные записи, над которыми мог- 
ли бы работать все желающие, комментируя или даже исправляя эти ошибки. От- 
крытое сообщество может решать проблемы, только если имеет открытый доступ 
к ним, а персональное электронное письмо закрытс для всего остального мира. 


гі.срап.ога 


Архив СРАМ, являющийся репозиторием, где хранятся тысячи проектов различ- 
ных авторов, тоже имеет свой инструмент слежения за ошибками. Для каждого 
дистрибутива выделяется отдельная очередь в Кедиеѕі ТгасКег (/іірѕ://гі.срап.ога). 
Это первый способ сообщать о проблемах в модуле. 


Другие средства слежения за ошибками 


Некоторые авторы модулей предпочитают использовать другие механизмы от- 
слеживания ошибок, отличные от РНрь://т{.срап.огя. Определить их предпочте- 
ния можно, прочитав документацию к модулю. Иногда авторы модулей включа- 
ют инструкции в документацию к своим модулям, а иногда нет. Поскольку фай- 
лы вроде РЕАРМЕ и МЕТА.уті удаляются во время установки, попробуйте оты- 
скать их на одном из сайтов проекта СРАМ бЅеагећ. 


репбид 


Чтобы сообщить об ошибке в модуле, поставляемом вместе с регі, можно восполь- 
зоваться утилитой ре фив. Она соберет информацию о вашей платформе и интер- 
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претаторе, чтобы те, кто будет заниматься диагностикой ошибки, имели всю не- 
обходимую информацию. В действительности эта утилита является интерфейсом 
для отправки особым образом форматированных электронных писем на адрес 
регіђрив@регі.оге, куда вы можете отправить письмо собственноручно, если поже- 
лаете. Эти отчеты автоматически направляются в список рассылки Регі 5 Рогфег$. 
Некоторые модули живут двойной жизнью, входя в состав стандартной библио- 
теки и в СРАМ, поэтому иногда бывает непросто выбрать правильное место для 
отправки отчета. Однако это не должно мешать вам отправлять сообщения о про- 
блемах. Отправляйте в ре Физ, а мы переправим его при необходимости. 


гЕ.реп.огд 


рейвиЕ отправляет отчеты об ошибках на сайт БКедиеѕі ТгасКкег (ћіір8://гЁ.регі.ога). 
Там же вы сможете ознакомиться со списком обнаруженных ошибок, включая 
ошибки в модулях из стандартной библиотеки. Посетите этот сайт, если вы ниче- 
го не обнаружите на сайте ћіїрѕ://гі.срап.огЕ. 


Установка модулей из СРАМ 


Существует две основных системы сборки, которые обычно используются автора- 
ми при создании дистрибутивов для СРАМ. Одна из них основана на утилите 
таке, а другая — исключительно на языке Ре. 


Вручную 


Дистрибутивы из СРАМ редко устанавливаются вручную, так как при этом при- 
шлось бы вручную разрешить все зависимости, что достаточно утомительно. Одна- 
ко это вполне возможно, и знание этой процедуры может пригодиться в будущем. 


Заглянув внутрь дистрибутива, вы наверняка обнаружите файл Маѓеѓіе.РІ, или 
Вийа.РГ.. Порядок их использования представлен в табл. 19.1. 


Таблица 19.1. Команды сборки при использовании двух основных инструментов 


Маке Ше.РТ Вона.РГ, 
% регі Макег11е. РЕ № рег] Виз19.РИ 
% таке % ./Виі10 
% паке теѕї % ./Виі1а тез 


% паке іпѕїа11 % ./Ви119 іпѕёа11 
С настройками по умолчанию обе системы попытаются установить дистрибутив 
в вашу библиотеку, с путями, настроенными вами (или кем-то другим) при уста- 
новке регі. Увидеть эти каталоги можно в конце вывода команды регі -У. 


У вас может оказаться недостаточно прав для записи в эти каталоги, но вы с та- 
ким же успехом можете выполнить установку в любой другой каталог по выбору, 
сообщив его файлу сборки. Поведение файлов сборки можно изменять посредст- 
вом параметров командной строки или переменных среды. 


х рег1 Маке?і1е. РІ ІМЅТАШ_ _ВАЅЕ=/ѕопе/оїћег/дігестогу 


Х регі Виі1а. Рі --іпѕћа11 баѕе /зоте/оїһег/дігесТогу 
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Если определить параметры в переменных среды, их не потребуется указывать по- 
вторно при установке очередного дистрибутива. Каждая система сборки имеет свои 
переменные среды для хранения параметров командной строки, принимаемых по 
умолчанию. Ниже показано, как настроить эти переменные в оболочке /біпу/зћ: 


Х өхрогі РЕВ _ММ_ОРТ= `ІМЅТАШ _ВАЅЕ= /ѕоте/оїћег/дігесТогу”` 
Х ехрогі РЕВЕ_МВ ОРТ='--4п$1а11_Базе /ѕоте/оїһег/дігесїогу" 


А вот как выполнить те же настройки в оболочке с3й: 


Х ѕетепу РЕВІ_ ММ ОРТ `ІМЅТАШ. ВАЅЕ=/ѕоте/оїћег/дігесіогу' 
Х ѕөтөпу РЕВІ_ МВ ОРТ "--іпѕёа11 Баѕе /ѕоте/оїћег/дігесїогу' 


Неважно, каким способом вы сообщите файлу сборки, куда следует выполнить ус- 
тановку. В любом случае, в конец каждого указанного пути будет добавлен подка- 
талог Б/регі5!. Запомните это, так как это знание пригодится в следующей части. 


Если модули устанавливаются в другой каталог, не забудьте сообщить програм- 
мам, где следует искать их, либо с помощью ключа -Ї: 


Х рег1 -І/зоте/отћег/дігесїогу/1ір/рег15 ргодгат. р1 
либо с помощью переменной среды РЕВ 5118: 


Х ехрогЕ РЕВІ5_ІВ=/соте/отћег/дігесїогу/і10/рег15 
Х рег? ргодгам. р1. 


Для этой цели в программах можно также использовать прагму 110: 
иѕе 110 ди(/зоте/отнег/91 гесфогу/116/рег15); 


Если вы не помните эти пути, воспользуйтесь модулем 10са1::116 из СРАМ (он не 
входит в стандартный дистрибутив Ре). Загрузив самого себя, он сообщит, ка- 
кое значение использовать. По умолчанию он использует подкаталоги в домаш- 
нем каталоге: 


х рег1 -М1оса1: :116 

ехрогі РЕВІ_ ОСА 11В_ВООТ=" /поте/ате1за”; 

ехрогї РЕВЕ_МВ_ОРТ=”“--1п$1а1] Базе /һоте/ате1:а/рег15 

ехрогі РЕВ. ММ_ОРТ=" ІМТАШ_ ВАЅЕ=/һоте/ате1іа/рег15 ° 

ехрогі РЕВЕБЕТВ=" /һоте/ате1іа/рег15/110/рег15/дагміп-21е%е1 ` /һоте/атеііа/рег15/110/ 
рег15"; 

ехрогі РАТН=" /Џѕегъ/ате1іа/рег15/0іп: $РАТН”; 


Можно также указать другой каталог: 


Х рег1 -М1оса1: : 11=/ѕоте/оїћег/аігесіогу 

ехрогЕ РЕВ ОСА 118 ВООТ=" /ѕоте/оїПег/і гестогу”; 

ехрогі РЕВЕ _МВ_ОРТ="--іпѕїа11 базе /ѕоте/оїһег/дігесїогу” : 

ехрогї РЕВІ_ММ_ОРТ=" ІМЅТАШ_ВАЅЕ=/ѕопе/оїћег/дігесіогу”; 

ехрогі РЕВ 511В=" /ѕзоте/оћег/дігесогу/11р/рег15/багміп-21еме1: /ѕопе/оЁһег/ 
дігесіогу/1ір/рег15"; 

ехрогї РАТН=” /ѕоте/оїћег/дігестогу/ріп: ЗРАТН" 


Вам все равно придется настроить переменные среды для себя, однако для про- 
грамм будет вполне достаточно простого использования 10са1::110: 


1 Это поведение по умолчанию. Его можно изменить, определив настройки Соп/ісиге 
с помощью ключа -0іпзїа1191у1е при компиляции регі. 
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иѕе 1оса1: :116; 


изе 1оса1::110 ом( /зопе/оіћег/дігестогу); 


Клиенты СРАМ 


Большинство предпочитают устанавливать модули с помощью программы-кли- 
ента.! Существует три популярных клиента СРАМ, и каждый разрабатывался 
для определенного круга пользователей со своими особыми потребностями. Не- 
обязательно все время использовать один и тот же клиент, и выбор клиента не 
является пожизненным. 


срап 


Команда срап, входящая в состав стандартной библиотеки и модуля СРАМ.рт, обес- 
печивает простой и быстрый способ установки модулей. Просто укажите ей. ка- 
кой модуль требуется установить: 


Х срап ТО: :ТпфегасЕ1уе АпуЕуепЕ 


Чтобы установить модули в другой каталог, необходимо выполнить соответст- 
вующие настройки. Если выполнить команду срап без аргументов, она запустит 
интерактивную оболочку СРАМ.рт: 


Х срап 

срап> о сопЁ пакер1 аго 1М№5ТАЦ-_ВАЗЕ=/зоте/отпег/аз гестогу 
Срап> о сопЁ трџиі1а аго “~-іпѕёа11 базе /ѕоте/оћег/дігесіогу" 
срап> о сопЁ соттії 


Запустить оболочку СРАћ.рт можно также командой: 


Х рег1 -МСРАМ -е ѕће11 
срап> 1п$та11 РОЕ 


или воспользоваться модулем 1оса1::110: 


Х регі -МСРАМ -М1оса1: :11р —е зпе11 
срап> 1п$1а11 5еї: : Сгоѕ$Ргодисї 


срапр 


В состав Рей входит еще один интерфейс к архиву СРАМ. СРАМРШ5. Целью этого 
проекта было учесть уроки разработки СРАМ. рп, а запускается этот интерфейс так: 


% срапр -1 ТО: :Іпіегасїіме АпуЕуепї 
Можно также запустить интерактивную оболочку СРАМРІ5: 


% рег1 -МСРАМРІОЅ -е ѕһе11 
СРАМ Тегтіпа1> 1п$1а11 РОЕ 


Интерфейс СРАМРІЏЅ использует систему настройки, управляемую посредством 
меню, поэтому, запустив ее в интерактивной оболочке, достаточно просто следо- 
вать ее подсказкам. 


* Илис помощью диспетчера пакетов, предоставляемого операционной системой. 
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сраптти$ 


Третий популярный клиент, который может вам понравиться, если вас удовле- 
творят его умолчания, – это сраптінпиѕ, или просто срапт. Это минималистич- 
ный клиент, стремящийся соответствовать требованиям большинства пользс- 
вателей. Он использует модуль 10са1::116 по умолчанию. Многие предпочитают 
именно эту программу, и она отлично подойдет вам, пока не потребуется что-то 
необычное. 


Поскольку отличительной чертой срапт является простота использования, кли- 
ент не требует установки дополнительных модулей.! Просто загрузите его и при- 
ступайте к использованию. Документация срапт (®Нрз://шши.теаасрап.огя/то- 
аше/Арр::сраптпиз) демонстрирует, как это сделать с помощью сигї,? с после- 
дующей передачей каталога через конвейер команде регі, чтобы превратить его 
в срапт. Это предпочтительный способ, потому что в этом случае срапт сможет 
извлечь необходимые настройки из регі: 


Х сиг1 -1 НЕТр: //сраптіп. иѕ | рег1 - Арр: : сраптіпиѕ 


Или сохраните его как срапт после загрузки и запустите. В УМХ это (по сути) то 
же самое, что сохранить результат превращения дистрибутива в выполняемый 
файл, однако в данном случае будет использоваться команда /изг/біп/епо для по- 
иска первой попавшейся версии регі: 


Х са -/біп 
Х сиг] -10 һер: //хг1. иѕ/срапт 
х сһтод +х срапт 


Сохранив срапт, его можно использовать для установки модулей: 


Х срапт НТМЕ: : Вагсоде 


Создание дистрибутивов для СРАМ 


Это короткое введение в создание дистрибутивов для распространения через 
СРАМ. Этой теме можно посвятить целую книгу.? Книга «Ицегше1ае Рег1»°, 
один из учебников по языку Рей, выпущенных издательством О’Кеіу. охваты- 
вает эту тему намного подробнее. 


Некоторые считают, что стандартная библиотека н действительности представляет со- 
бой лишь начальный комплект модулей, и поэтому вам может потребоваться исполь- 
зовать срап или срапр. Посмотрим, как это скажется на будущих версиях. Кстати, это 
одна из интереснейших тем, способных оживить самую унылую дискуссию пользова- 
телей Реп. Просто упомяните об этом и отстуците на шаг, чтобы понаблюдать за жар- 
кими баталиями. 


си – инструмент командной строки для передачи данных (®Нр://си\й.вахх.зе). 


з И такая книга была написана: баш Тгераг «Мтіііпе Рег] Модиез юг СРАМ» (пир:// 
или. аргезз.-сот/9781590590188), Аргезз. 


Рэндал Л. Шварц, брайан д фой, Том Феникс «Рен: изучаем глубже», 3-е издание». — 
Пер. с англ. — СПб.: Символ-Плюс, 2014. 
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Приступая к созданию дистрибутива 


Архив СРАМ существует достаточно давно. С тех пор появилось множество усто- 
явшихся приемов и соглашений, поэтому на сегодняшний день практически все 
согласны с перечнем того, что должно входить в дистрибутив. Вам не придется 
начинать с чистого листа, если вы воспользуетесь инструментами для создания 
заготовки своего дистрибутива. 


Һ2х5 


Канонический инструмент создания дистрибутивов, который в действительности 
не является инструментом создания дистрибутивов. Как следует из названия, он 
предназначен для преобразования заголовочных файлов на языке С в файлы на 
языке ХЅ, промежуточном языке, связывающем Рен и С. Он продолжал разви- 
ваться долгие годы, даже при том что большинством применялся не по основному 
назначению: 


ҳ һ2х5 -ХАп Ѕопе: : Моди]е 
реғац1+іпо їо баскмага сотратірі1і+у міїћ регі 5.14.2 


Мгіїіпо Зоте-Моди1е/116/5оте/Моди1е. рт 
Игіеі по Ѕоте-Модџ1е/Макеғі1е. РЕ 
Мгітіпо Зоте-Моац1е/ВЕАРМЕ 

Мгітіпо Ѕоте-Моац1е/+ /Ѕоте-Мойџи1є. т 
Мгітіпо Ѕоте-МодиЈе/Сһапдеѕ 

Мгітіпо Ѕоте~-Моди1е/МАМІҒЕЅТ 


Огѕпбибоп::СооКег 


Модуль 0іѕїгірџи+іоп::Соокег принадлежит к числу простейших инструментов соз- 
дания дистрибутивов и проектировался для тех, чьи требования не слишком вы- 
соки.! Он подготавливает каталог с шаблонами, позволяя вам проектировать ваш 
дистрибутив по своему усмотрению и затем тиражировать свои настройки. Когда 
все будет готово, вам не потребуется каждый раз изменять вывод других инстру- 
ментов. И верно, оптимальный способ использовать 015їгіриїіоп::Соокег — начать 
с изменения вывода других инструментов, пока не будет получен желаемый ре- 
зультат, а затем переходить к проектированию соответствующего шаблона. 


Моаиіе::5анег 


Модуль Моде: :Зфагтег – лучший инструмент для тех, кто пока не знает, чего хо- 
чет. Вы начинаете с создания файла настройки в ${НОМЕ). тодаше-затег/сопйя 
и совсем немного набираете на клавиатуре: 


аџїіћог: Ате11а Сате1 
ета11: ате1іавехатр1е. сот 
биі1бег: Моди1е: : Виі1а 
уегроѕе. 1 


Затем запускаете тоаиіе-ѕіагієг и получаете базовую структуру дистрибутива: 


1 Модуль 0іѕігібиіоп::Соокег попал в эту книгу только потому, что написан и использу- 
ется одним из авторов книги. 
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Х поди1ө-зїагъег --тоди1е=5опе: : Мойџ162 
Сгеатеа Зоте-Моди1е 

Сгеатед Зоте-Моди1е/116/Зоте 

Сгеатеа 5оте-Моди1е/116/Зоте/Модите2. рт 
Сгеатед Ѕоте-Моаџ16/ї 

Сгеатеа зоте-Моди1е/Е/род-соуегаде. + 
Сгеатеа Ѕоте-Модџ1е/ї/роа. ї 

Сгеатед Ѕоте-Модие/ї/тапіғеѕї + 
Сгеаїеа Ѕоте-Моди1е/+/роі]егр1ате + 
Сгеатео Ѕоте-Мойи1е/+/00-1оаа. Е 

Сгеа+еа Ѕоте-Моди1е/ідпоге. їхЕ 

Сгеатеа Ѕоте-Мойџ1е/Виі1а. РЬ 

Сгеатеа Ѕоте-Моаџ1е/Сһапдеѕ 

Сгеатед $оте-Моди1е/НЕАОМЕ 

Сгеаїеа боте-Моду1е/МАМТЕЕЗТ 

Сгеатей ѕтагтег бігесіогіеѕ ап@ Ғі1еѕ 


Обратите внимание на тестовый файл 80те-Моаиі1е//Бойегріатеі. Это то место, 
куда можно обратиться, чтобы увидеть изменившиеся значения по умолчанию, 
такие как описание модуля. 


05:2 Йа 

Модуль 0151::711]1а- достаточно сложный инструмент, который умеет гораздо 
больше, чем просто создавать заготовку дистрибутива. Он позволяет управлять 
полным жизненным циклом модуля, от идеи до воплощения, а затем выпуском, 
тестированием, исправлением оптибок и повторным выпуском. Он слишком слож- 
ный, чтобы описывать его здесь, но многим он нравится. 


Тестирование модулей 


Высокая культура тестирования – одна из самых привлекательных особенностей 
языка Рей. Мы уже упоминали о СРАМ Тезегз, людях, которые тестируют все ди- 
стрибутивы, имеющиеся в СРАМ, на различных платформах. Вам, как автору, са- 
мому решать, как реализовать свои тесты. Мы не собираемся рассказывать здесь 
обо всем, что имеет отношение к тестированию, потому что об этом немало расска- 
зывается в других книгах, таких как «Іпіегтедіаѓе Регі» и «Рег Тезипе: А Оеуе- 
1орег’з МофеБоокК». 


Внутреннее тестирование 


Если вы пользуетесь одним из двух стандартных инструментов сборки дистрибу- 
тивов, инструменты тестирования у вас уже имеются. Запустить тестирование 
можно командами: 


Х паке тез 


х ./Виі1а їеѕї 


Обе они работают одинаково: просматривают содержимое файла ѓеѕі.рі или ката- 
лога #/. Файл ѓеѕі.рі – это пережиток прошлого, когда все тесты хранились в един- 
ственном файле. Подкаталог #/ – это более удобный подход, потому что в нем 
можно сохранить множество тестовых файлов с расширением .ї, которые будут 
выполнены механизмом тестирования. 
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Каждый файл с тестами – это обычная программа на языке Рей, обычнс исполь- 
зующая в своей работе модуль Тез": :Моге. Ниже приводится пример тестового 
файла, который загружает модуль Ма! 1. .МуЗип и тестирует его метод пу_зит: 


иѕе $1г1ст; 
иѕе магп1п9$; 
узе Тезт: :Моге; 


ВЕСТМ { иѕе ок( `Маїћ: :МуЅит" ) } 
сап _ок( “Маїћ: .Мубит”. "ту ѕит" ); 


пу($1, $1) = (1, 3); 
пу $37119 = "Ате1іа"; 


18($1 + $], Маїһ: :Мубит->ту_зит( $1, $1 ) 
“бит о? $1 апа $] 1$ 4”); 


11ке($51г1п9, аг/те1/, “511119 Ваз пе1 іп 11“); 


допе_Те$11п9; 


Эти программы выводят результаты тестирования в формате ТАР (Тез Апуућеге 
Ргофосо] – универсальный протокол тестирования), простом текстовом формате, 
разработанном Ларри и дополненном другими. Ниже представлен вывод этой 
программы в формате ТАР: 


ок 1 - изе Мати: :Мубит; 

ок 2 - Мати: :МуЅит->сап( ‘ту ѕит ) 
ок 3 - им ОЕ 1 апа 3 1$ 4 

ок 4 - Ѕтгіпо паз ме? іп ії 

1..4 


Имеется также возможность запускать тесты по отдельности, используя модуль 
0110 для автоматического добавления библиотек сборки в @ТМС: 


Х рег1 -МЬ11Ь т/Ра111потезт. 1 
Кроме того, можно задействовать инструмент ргоие: 
Х ргоме -\Ь /Ғаі1іпд+еѕї.ї 


Самое важное при создании комплектов тестов — охватить тестированием весь 
код. Поскольку вы являетесь автором и модуля, и тестов, вы легко можете обеспе- 
чить прохождение тестов, исключив тестирование наиболее сложных частей мо- 
дуля. Чтобы убедиться, что это не так, воспользуйтесь модулем Пе\уе1: :Соуег и его 
программой соуег, измеряющей процент покрытия программного кода тестами: 


х соуег -Тезѕї 


Команда соиег автоматически выполнит комплект тестов, соберет статистиче- 
скую информацию и выведет отчет: 


1 Многие другие языки программирования заимствовали протокол ТАР. Программа, 
производящая вывод в формате ТАР, необязательно должна быть написана на том же 
языке, что и программа, анализирующая результаты в формате ТАР. 
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Кеао1пд датабаѕе Ргот ./сомег_в6 


Игітіпо НТМЕ оцЕриф то ./сомег_д6/соуегаде. һіт1 . 
оопе 


Она измеряет покрытие четырех видов: 
инструкции 

Выполнение каждой инструкции. 
ветви 


Тестирование каждой ветви, например, когда инструкция і? имеет несколько 
блоков е151ї, каждый из которых рассматривается как отдельная ветвь. 


условия 


Тестирование каждой комбинации условий, если возможно множество комби- 
наций. Например, ниже демонстрируется такое условие в операторе 11: 


1Ғ ($т 88 $1) { .} 


Этот оператор і? имеет три тестируемых комбинации: когда $п и $п имеют ис- 
тинные значения; когда $7 может иметь ложное значение - и в этом случае 
значение $п не принимается во внимание; когда $ может иметь истинное зна- 
чение, а $п – истинное или ложное. Тестирование должно охватывать каждую 
из этих ситуаций. 


подпрограммы 


Вызов каждой подпрограммы, что также является частью показателя, учиты- 
вающего выполнение каждой инструкции. 


Внешнее тестирование 


Когда дистрибутив будет опубликован в репозитории РАОЅЕ, его автоматически 
«подхватит» и протестирует инфраструктура СРАМ“ Теѕќегѕ, после чего вам будут 
высланы результаты тестирования. Это удобно для тестирования на платформах 
и версиях Рей, которых у вас нет. Для этого вам не придется делать ничего осо- 
бенного. 


Однако такая услуга доступна только для свободно распространяемых дистрибу- 
тивов. Если вы не планируете передавать окончательную версию в СРАМ, вы все 
равно можете обеспечить внешнее тестирование, настроив собственную систему 
СРАМ Тезегз на своей ферме тестовых машин. Для этого можно использовать те 
же инструменты, которыми пользуется система СРАМ Тезегз, но при этом они 
будут загружать дистрибутивы из ваших частных источников. 


Вы можете также интегрировать тестирование программ на Регі в одну из систем 
непрерывной интеграции, такую как ѕтоідег (созданную специально для Рей, но 
не ограниченную им), Нидзоп, Јепкіпѕ или ТеатСіїу. Любой инструмент, пони- 
мающий отчеты в формате ТАР (их существует множество), может использовать- 
ся для анализа вывода ваших тестов. 


ТУ 


Ре! как культура 


Защита данных 


Всякий раз, имея дело с пользователем, набирающим команды на клавиатуре, 
или получая от кого-то информацию по сети, следует осторожно обращаться 
с данными, поступающими в вашу программу, поскольку другой человек может, 
по злому умыслу или случайно, послать вам нечто такое, что причинит вред. Рей 
предоставляет специальный механизм проверки безопасности, носящий назва- 
ние режим меченых данных (іаіпі тойе), назначением которого является изоля- 
ция данных, поступивших в вашу программу извне, чтобы вы не смогли сделать 
с их помощью что-то такое, чего делать не собирались. Например, доверившись 
по ошибке содержащей имя файла строке сомнительного происхождения, можно 
добавить запись в файл паролей, думая, что это файл журнала. Подробнее меха- 
низм режима меченых данных описывается в разделе «Обработка ненадежных 
данных». 


В многозадачной среде закулисные действия невидимых актеров могут повлиять 
на безопасность вашей собственной программы. Тот, кто полагает, что единолич- 
но владеет внешними объектами (в особенности файлами), как если бы его про- 
цесс был единственным в системе, подвергает себя значительно менее очевидным 
опасностям, чем те, что возникают вследствие работы с данными или кодом со- 
мнительного происхождения. Ре! оказывает кое-какую помощь, выявляя ряд 
ситуаций, которые мы не можем контролировать; что касается ситуаций, кото- 
рые мы контролировать можем, тут главное — понимать, какие подходы надежно 
противодействуют невидимому вмешательству. Эти вопросы обсуждаются в раз- 
деле «Обработка ошибок синхронизации». 


Если извне мы получаем не данные, а фрагмент кода для выполнения, следует 
проявлять еще большую осторожность, чем с данными. Регі поддерживает неко- 
торые проверки, позволяющие перехватить скрытый код, маскирующийся под 
данные, чтобы ненароком не выполнить его. Если вы все же хотите выполнить 
посторонний код, модуль Ѕаѓе позволит поместить подозрительный код в каран- 
тин, где он не причинит никакого вреда и, может быть, сделает что-нибудь полез- 
ное. Это темы раздела «Обработка ненадежного кода». 
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Рей облегчает безопасное программирование, даже когда вашу программу ис- 
пользует кто-то, кому можно доверять еще меньше, чем самой программе. Это зна- 
чит, что некоторые программы должны ограничивать права своих пользователей. 
В ОМІХ в эту категорию попадают программы зейиа и ѕеісіа, как и программы, 
работающие в привилегированных режимах в других операционных системах, 
поддерживающих такие понятия. Даже в системах, которые их не поддерживают, 
те же принципы применимы к сетевым серверам и любым программам, выпол- 
няемым этими серверами (например, сценариям ССІ, процессорам почтовых спи- 
сков рассылки и демонам, перечисленным в /еѓс/іпеіа.соп}). Все такие программы 
требуют более пристального внимания, чем обычные. 


Даже программы, выполняемые из командной строки, иногда являются хороши- 
ми кандидатами на включение режима проверки меченых данных, особенно ес- 
ли их будет выполнять привилегированный пользователь. Программы, обраба- 
тывающие сомнительные данные, например собирающие статистику по файлам 
журналов или получающие удаленные данные с помощью [ШР::* и №ї::*, следует 
запускать с явным включением режима проверки меченых данных; программы, 
не проявляющие осторожность, рискуют превратиться в «троянского коня». По- 
скольку, идя на риск, программы не получают порции адреналина. у них нет осо- 
бых оснований не быть осторожными. 


В сравнении с интерпретаторами командной строки ОМХ, которые, в сущности, 
лишь создают условия для вызова других программ, на Рег] легко писать защи- 
щенные программы, поскольку он прост и самодостаточен. В отличие от боль- 
шинства языков программирования командных интерпретаторов, основанных 
на многократной обработке каждой строки сценария с таинственными подстанов- 
ками, Рег использует более общепринятую схему вычислений с меньшим коли- 
чеством тайных подвохов. Кроме того, поскольку в Рег] больше встроенных функ- 
ций, он меньше полагается на внешние (и, возможно, не заслуживающие дове- 
рия) программы для выполнения своих задач. 


В ОМІХ, откуда Регі родом, предпочтительный способ компрометации системы 
безопасности — обманом заставить привилегированную программу сделать что- 
то, для чего она не предназначалась. Чтобы предотвратить такие атаки, Рег] при- 
обрел уникальный метод противостояния враждебному окружению. Рег! автома- 
тически включает режим проверки меченых данных, когда обнаруживает, что 
текущий (еѓѓесііуе) идентификатор пользователя или группы программы отлича- 
ется от реального (геа]).! Даже если для файла сценария Регі не установлены биты 
ѕеішій и ѕеірій, этот сценарий все равно может быть переведен в режим меченых 
данных. Это произойдет, если сценарий будет вызван другой программой. которая 
сама выполнялась с другим идентификатором. Программы на Регі, не предназна- 
чавшиеся для работы в режиме проверки меченых данных, могут досрочно пре- 
кращать свое существование, будучи застигнутыми в момент нарушения правил 


1 Бит зенаЯ в правах доступа ОМХ имеет значение 04000, а бит ѕеіріа имеет значение 
02000; можно установить один из них или оба, чтобы дать пользователю программы 
некоторые права владельца (или владельцев) программы. (В совокупности их называ- 
ют программами 564-14.) Другие операционные системы могут давать программам осо- 
бые права другими способами, но принцип остается тем же. 
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безопасности. И это правильно, ведь именно такие интриги исторически плелись 
в сценариях интерпретатора команд для компрометации защиты системы. Ре 
не столь доверчив. 


Режим проверки меченых данных можно активировать явно, с помощью ключа 
командной строки -Т. Это нужно делать для демонов, серверов и любых программ, 
работающих от чужого имени, например сценариев ССІ. Программы, которые 
можно запускать удаленно и анонимно с любой машины в Сети, выполняются 
в самом враждебном из возможных окружений. Не бойтесь сказать «Нет!». Вопре- 
ки распросзраненному мнению, можно проявлять значительную осторожность 
и не стать при этом усохшим морщинистым ханжой. 


Для сайтов, заботящихся о безопасности, выполнение всех сценариев ССІ с фла- 
гом -Т не просто хороший тон: это закон. Мы не утверждаем, что запуск в режиме 
проверки меченых данных сделает сценарий безопасным, поскольку это не так. 
Простое перечисление того, что сделает сценарий безопасным, займет целую кни- 
гу. Ноесли вы не используете режим проверки меченых данных при выполнении 
своих сценариев ССТ, значит, без всякой необходимости пренебрегли самой силь- 
ной защитой, которую может дать Регі. 


В этом режиме Ре! предпринимает особые меры предосторожности, называемые 
проверками меченых данных (іаіпі сћесЕѕ), чтобы избежать очевидных и скрытых 
ловушек. Некоторые из этих проверок довольно просты, например отсутствие 
опасных переменных среды, запрет на запись посторонними в каталоги, перечис- 
ленные в переменной среды РАТН; но осторожные программисты всегда использо- 
вали такие проверки. Есть, однако, другие проверки, которые лучше всего под- 
держиваются самим языком, именно они и делают привилегированную програм- 
му на Рей более надежной, чем соответствующая программа на С, а сценарий ССІ 
на Ре более надежным, чем написанный на языке без проверки меченых дан- 
ных. (А таковым, насколько нам известно. н„вляется любой язык, кроме Регі.) 


Принци прост: нельзя использовать данные, полученные извне выполняемой 
программы, для воздействия на что-либо еще, находящееся за ее пределами, во 
всяком случае, намеренно. Любые данные, поступающие в программу извне, «по- 
мечаются» как данные сомнительного происхождения (ќаіпёед), в том числе все 
аргументы командной строки, переменные среды и данные, прочитанные из фай- 
лов. Меченые данные нельзя использовать прямо или косвенно в операциях, по- 
рождающих вложенный интерпретатор команд, а также в операциях, модифи- 
цирующих файлы, каталоги или процессы. Любая переменная, устанавливаемая 
в выражении с участием меченого значения, сама становится меченой, даже если 
логически невозможно, чтобы меченое значение повлияло на переменную. Одна- 
ко использование меченой переменной для выбора немеченого значения не приво- 
дит к отметке результата. Например, $уа1ше в этом примере не помечается: 


пу $уа1џе = $+аіпіеа ? Апе11а` : `Сате1л1а`; # $уа1џе не помечается. 
и в этом тоже: 


ту $уа1ие = до { 
1?( $аіпіеа } { Ате]1а } 
е1ѕе { `Сате1іа’ } 
}; 
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Поскольку Ре! помечает отдельные скаляры, в массиве или хеше одни значения 
могут оказаться мечеными, а другие - нет. (В хеше мечеными могут быть только 
значения, но не ключи. Подробнее об этом чуть ниже.) 


Следующий код иллюстрирует, как будут работать меченые данные, если выпол- 
нить по порядку все эти команды. Команды, отмеченные словом «ненадежна» 
создают исключительную ситуацию, а те, которые отмечены «ОК», — нет. 


Фаго = $1 РЕ(еАВСУ), # Фагд теперь помечена (из-за @АВбУ). 
$һіа = "Фагд, ‘Баг””; # $110 тоже помечена (из-за Фагд). 
$1іпе = <>; # Помечена (чтение из внешнего файла) 
фраен = ФЕМУ{РАТН}; # Помечена из-за ЖЕМУ. но смотрите ниже 
$тіпе = “абс”; # Не помечена. 


Ѕуѕтет "есһо $т1пе“: # Ненадежна, если не установлена РАТН. 

зузтет "есһо $агд"; # Ненадежна: использует зп с меченой $аго. 
Ѕуѕіет ”еспо” Фагд; # ОК, если РАТН установлена (не использует 31), 
зузтет “еспо $119”; # Ненадежна по двум причинам: меченая $119, РАТН 
$о19ратн = $ЕМУ{РАТН}, в $019рафп меченая (из-за ЖЕМ№). 

ФЕММ{РАТН} = “/блп:/изг/бли”, # ОК (разрешает выполнять другие программы. ) 
$пемраїћ = ФЕМ\У{РАТН}; 8 фпемраїћ НЕ помечена. 


де1ете @ЕМУ{ дм{ ТЕЗ 
СОРАТН 
ЕМУ 
ВАЗН_ЕМ\} }; # Делает ЖЕМУ более безопасной. 


зузтет "есһо $тіпе", # ОК безопасна после переустановки РАТН 
зуѕїет “еспо $п10”; # Ненадежна из-за $119. 

ореп(00Е, "< $аго”); # ОК (ореп только для чтения нє проверяются) 
ореп(00Е, "> $агд"); # Ненадежна (запись в меченый аргумент) 
ореп(00Е, “еспо $аго[") # Ненадежна из-за меченой $а"9, но 


|| 91е “невозможность конвейера из еспо: $! 


ореп(00Е, "-|") # Считается ОК: см. ниже меченое 
|| ехес "есһо", Фагд # исключение при выполнении списка 
|| 91е "невозможно ехес еспо: $1”; 


ореп(00Е, "-|”, “еспо”, $агд) # То же, что предыдущее, ОК. 
|| діе “ невозможность конвейера из еспо: $!”; 
$ѕһоиё = ‘еспо Фагд`; # Ненадежна из-за меченой $агд 
феһоиі = `есһо абс`; # $5һои помечена из-за обратных апострофов. 
фепоиЕ2 = ‘еспо $5һоиЁ`; # Ненадежна из-за меченой $ѕһоџі 
ип1іпк $тіпе, $аго; # Ненадежнг из-за меченой $ағо 
итазк $аго; # Ненадежна из-за меченой $аго. 


ехес “есво $аго”; # Ненадежна из-за меченой Фагд, 

# передаваемой интерпретатору команд 
# Считается ОК! (Но смотри ниже. ) 

# 


Считается ОК, но в действительности не так! 


ехес "есһо", Фагод; 
ехес “ЗВ”, "-с", Фагд; 
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Если попытаться сделать что-то небезопасное, возникнет исключительная ситуа- 
ция (которая, если не перехватывается, становится фатальной), например, Гпзесиге 
Черепдепсу” или “Тпзесиге ФЕМАРАТН}". См. далее раздел «Наведение порядка в ок- 
ружающей среде». 

При передаче списка вызову зузТет, ехес или ореп для канала, происхождение ар- 
гументов не проверяется, потому что, когда аргументы представлены списком, 
Рей не требуется вызывать потенциально опасный интерпретатор команд, чтобы 
выполнить команду. Можно с легкостью написать ненадежные Ѕуѕїет, ехес или 
ореп для канала с использованием списочного формата, как показано в последнем 
примере выше. Эти формы освобождаются от проверки, поскольку предполагает- 
ся, что вы используете их осознанно. 


Иногда, впрочем, невозможно определить, сколько аргументов передается. Пере- 
дача этим функциям массива!, содержащего только один элемент, равноценна пе- 
редаче одной строки, поэтому может быть использован интерпретатор команд. 
Выход в том, чтобы передать явный путь через косвенные аргументы: 


зузфет @агд$; # Интерпретатор вызывается только при @агдз == 
ѕуѕтет { $агодѕ[0] } @агоз; # Обходит интерпретатор, даже если один аргумент. 


Обнаружение и очистка меченых данных 


Чтобы проверить, содержит ли скалярная переменная данные сомнительного 
происхождения, можно обратиться к функции іѕ їаіпїей, описываемой ниже. Она 
использует то обстоятельство, что е\уа1 57н/№Мб возбуждает исключение при попыт- 
ке компиляции данных сомнительного происхождения. Неважно, что перемен- 
ная Фпада, используемая в компилируемом выражении, всегда будет пустой; она 
все равно окажется меченой, если помечена $аго. Внешняя проверка еуа1 ВОСК не 
производит компиляцию. Ее задача — перехватить исключительную ситуацию, 
когда внутренняя е\а1 получит меченые данные. Поскольку гарантируется, что 
переменная $6 не будет пустой после каждого вызова еуа1, если возникла исклю- 
чительная ситуация, и будет пустой в противном случае, мы возвращаем резуль- 
тат сравнения длины содержимого этой переменной с нулем; 


3и6 15 Талптес { 
ту Фаго = ѕһіғ+; 
пу $пада = ѕирѕ+г($а"9, 0, 0); # нулевая длина 
1оса1 $6; # сохраните версию вызывающей программы 
е\а1 { еуа1 “# $пада” } 
геёигп 1епоїһ($@) != 0; 
} 


Модуль Ѕса1аг::111, входящий в состав стандартного листрибутива Регі, уже име- 
ет подобную функцию с именем їаіпіей: 


џѕе Ѕса1аг: :0411] ам(+аіпіеа); 
ргіпї "Таї1піеа! " 1? +а1пїеа( ФАВбУГО] ). 


Модуль Та1пі::0+11 из СРАМ пошел еще дальше. Он предлагает не только функ- 
цию їаіпїей, реализующую то же самое, но и функцию їаіпі, позволяющую поме- 
тить любые данные: 


і Или функции, создающей список. 
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иѕе Таіпі: :411 ом(таіпіед +аіпї); 


ту $ѕса1аг = `Тһіѕ 1$ ипіаіпёед’'; # непомеченная 
Таіпї( $ѕсаЛаг ); # теперь меченая 


Это может пригодиться для тестирования сценариев с мечеными данными: 


изе Тезт: :Моге; 
изе Та1пе: :0111 ам(таіпіеа їаіпі); 


пу $Та1птед = 'Тһіѕ 1$ ипёаіпїеа`; # непомеченная 
Таіпі( $Тта1отей ); # теперь меченая 


ок( ТазиЕед( $таіпїед ), ‘Вафа аге їаіпїед' ); 
1$( геғиѕе То могк( $аіптед ). опдеғ, `Ветигпз ипаеЁ мати та1птеа дата ); 


допе_іеѕїіпо(); 


Но проверка происхождения данных — лишь часть дела. Как правило, мы пре- 
красно знаем, какие переменные содержат меченые данные, и надо лишь сбро- 
сить признак «помеченности». Единственный официальный путь обхода меха- 
низма проверки меченых данных – это ссылка на вложенные соответствия, полу- 
ченные ранее операцией сопоставления с регулярным выражением. Если шаб- 
лон содержит сохраняющие скобки, к найденным подстрокам можно обращаться 
через переменные $1, $2 и $+, либо применив шаблон в списочном контексте. В лю- 
бом случае предполагается, что писали шаблон осознанно, и написали его так, 
чтобы вычистить все, представляющее опасность. Поэтому следует крепко поду- 
мать, прежде чем просто снять «помеченность», иначе вы нарушите работу этого 
механизма. 


Лучше убедиться, что переменная содержит только «хорошие» символы. чем 
проверять наличие «плохих», потому что последние слишком легко пропустить, 
если вы о них не подумнли. Следующий тест проверяет, не содержит ли $5їгіпо 
что-нибудь, кроме «символов слов» (букв. цифр и подчеркиваний), дефисов, зна- 
ков @ и точек: 


11 ($віг1по =- /^([-\@\м. 1+)$/) { 
$$1г1п9 = $1; # $51гіпо теперь не помечена. 
} 
е1зе { 
діе “Плохие данные в $51г1п9"; # Записать куда-то в журнал. 


} 


В результате $51гіпо становится достаточно безопасной для дальнейшего исполь- 
зования во внешней команде, так как /\и+/ обычно не соответствует метасимво- 
лам интерпретатора команд, да и другие символы не должны означать для него 


' Неофициальный путь состоит в том, чтобы сохранить меченую строку как ключ хеша 
и получить этот ключ обратно. Поскольку ключи не являются в действительности пол- 
ноценными 5У (внутреннее имя для ѕсајаг уајиеѕ — скалярных значений), у них отсут- 
ствует свойство «помеченности». Однако такое поведение может в один прекрасный 
день поменяться, поэтому не следует на него полагаться. Будьте осторожны при работе 
с ключами, чтобы не снять непреднамеренно «помеченность» со своих данных и не сде- 
лать с ними что-нибудь небезопасное. 


Обработка ненадежных данных 623 


чего-либо особенного. Если бы мы использовали /(.+)/з, это было бы небезопасно, 
поскольку такой шаблон пропускает все. Но Рег] это не проверяет. При снятии 
«помеченности» будьте предельно осторожны со своими шаблонами. Очистка дан- 
ных с помощью регулярных выражений является единственным одобряемым ме- 
ханизмом снятия метки с «грязных» данных. А иногде это оказывается совершен- 
но неверным подходом. Если сценарий оказывается в режиме проверки меченых 
данных из-за запуска с повышенными привилегиями, а не потому, что был указан 
ключ -Т, уменьшить риск можно, породив процесс (ѓогКк а сћіа) с пониженными 
привилегиями; см. раздел «Наведение порядка в окружающей среде». 


Прагма изе ге 'їаіпї` запрещает неявное снятие меток при поиске по шаблону до 
конца текущей лексической области видимости. Ее можно использовать, чтобы 
извлечь какие-то подстроки из потенциально меченых данных, и оставить эти 
подстроки мечеными, чтобы отложить принятие мер по защите на потом. 


Предположим, что вы осуществляете такой поиск, причем $ѓи11раїћ является ме- 
ченой: 


($0іг, ФРіЛе) = $Ғи11раїһ =- т! (.*/)(.*)! 3 


По умолчанию $01г и $111е теперь не будут помечены. Но, вероятно, вы не стали бы 
делать это столь бесцеремонно, если бы задумались о проблемах безопасности. На- 
пример, было бы не слишком радостно получить в $111е строку "; гт -г? * ;, что 
можно привести в качестве довольно вопиющего примера. В следующем примере 
две переменные с результатами остаются мечеными, если помечена $ѓи11раїћ: 


{ 

изе ге “Таіпі”, 

($91г, фғ11е) = $ғиЈ1раїһ =- т! (.+/)(.*)!5; 
} 


Разумно по умолчанию оставлять вложенные соответствия мечеными по всему 
исходному файлу, и лишь при необходимости избирательно разрешать снятие ме- 
ток во вложенных областях видимости: 


и5е ге "Таіпї"; 
# в остальной части файла $1 и другие остаются мечеными 
{ 
по ге “Талпт”; 
# в этом блоке снимаются метки при поиске регулярных выражений 
1# ($пит == /7(\0+)$/) { 
$пип = $1 


} 


Данные, полученные из дескриптора файла или каталога, помечаются автомати- 
чески, за исключением случая, когда они извлекаются из особого дескриптора 
РАТА. При желании другие дескрипторы тоже можно пометить, как заслуживаю- 
щие доверия, с помощью функции ипїаіпї из модуля 10::Напо1е: 


Если только вы не используете специально искаженные национальные настройки. 
Рен допускает возможность компрометации национальных настроек системы. Поэто- 
му при выполнении с директивой изе 1оса1е шаблоны, содержащие классы, такие как 
\м или [[:а1рћа:1], дают недостоверные результаты. 
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у$е 10: : напое; 


10: : Нап ]1е: :ипіаіпі( •$0МЕ_ЕН); # Либо как процедуру, 
ЗОМЕ_ЕН->ипта1п():; # либо в стиле 00П 


Отключение пометки данных для дескриптора в целом является рискованным 
шагом. Откуда вы можете знать, что он действительно безопасен? Если вы соби- 
раетесь это сделать, то должны хотя бы проверить, что никто, кроме владельца, 
не может осуществлять запись в этот файл. Если вы работаете с файловой систе- 
мой МХ (в которой вызов сйоишп(2) благоразумно разрешен только суперпользо- 
вателю), можно использовать такой код: 


иѕе Рі1е: :ъїаі; 

уе Зутбо1 "диаііѓу то ге”; 

зиб һапд1е 100к6 _Ѕаѓе(*) { 
пу $#п = диа11Ру їо ге?(ѕћі?і, са11ег); 
пу $іпғо = ѕќа($#һ); 
геїигп ип1езз $4110; 


# владельцем не являются ни суперпол_зователь, ни “я” 
# чей реальный и109 находится в переменной $< 
1 ($1070-2>19 != 0 88 $іпғо->и1а != $<) { 

гефигт 0; 


} 


# проверить, могут ли писать в файл группа или другие. 
# использовать также 066 для определения возможности чтения 
1 ($іпғо->тоде & 022) { 
гефигт 0; 
} 


гефигп 1; 
} 


иѕе 10: :Напо1е; 
ЗОМЕ_НН- >џпіаіпї() 1Г һапа1е 100к5 _ѕағе( +50МЕ ЕН) 


Мы вызывали ѕіаї для дескриптора файла, а не его имени, чтобы избежать опас- 
ной ситуации, в которой велика вероятность взаимоблокировок. См. раздел «Об- 
работка состояния гонки» далее в этой главе. 


Заметим, что эта программа служит лишь хорошим началом. Несколько более 
параноидальная версия проверила бы еще все родительские каталоги, даже не- 
смотря на то, что применение ѕїаї к дескрипторам каталогов не дает надежных 
результатов. Но если в какой-нибудь родительский каталог может осуществлять- 
ся запись кем угодно, знайте — вы в опасности, независимо от того, возникает ли 
состояние гонки (гасе сопд1 оп). 


Рег! имеет собственное представление о том, какие операции опасны, но нажить 
неприятностей можно через другие операции, которые не анализируют свои аргу- 
менты. Не всегда можно ограничиться проверкой входных данных. Функции вы- 
вода Ре! не проверяют, являются ли мечеными их аргументы, но в некоторых 


1 С дескриптора каталога тоже можно снять признак мечености, но конкретно эта функ 


ция работает только с дескриптором файла. Это связано с тем, что в случае дескриптора 
каталога не существует переносимого способа передать его указатель файла в ѕтаї. 
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окружениях это существенно. Если не следить за тем, что выводится, получатель, 
обрабатывающий эти данные, может столкнуться с неожиданными эффектами 
обработки. Если вы работаете с терминалом, некоторые управляющие символы 
и коды могут вызвать такое поведение терминала, которое озадачит пользовате- 
ля. В среде веб-сервера бездумный возврат полученных из другого источника дан- 
ных может привести к непреднамеренному внедрению в страницу тегов НТМГ, 
которые кардинально изменят ее внешний вид. Хуже того, некоторые теги спо- 
собны привести к выполнению кода в браузере. 


Представьте типичную гостевую книгу, где пользователи оставляют свои сообще- 
ния, доступные другим посетителям. Гость-злоумышленник может передать спе- 
циальные теги НТМІ, или вставить теги <5СНАТРТ>...</ЗСАТРТ>, которые выполнят 
код (например, ТауаЗсг1рё) в браузерах других посетителей. 


Следует проявлять такую же осторожность в среде веб при выводе данных, полу- 
ченных от пользователя, как при проверке на отсутствие недопустимых симво- 
лов при просмотре меченых данных, обращающихся к ресурсам вашей собствен- 
ной системы. Например, чтобы удалить все символы, не входящие в список одоб- 
ренных, попробуйте конструкцию вроде этой: 


$пем _оиеѕїроок_епігу =- їг[_а-2А-20-9 ,./!?()@+*-1[]9с; 


Конечно, не следует использовать эго для обработки имени файла: как минимум, 
вам едва ли нужны имена файлов с пробелами и косыми. Но, чтобы в вашу госте- 
вую книгу не прокрались теги и объекты НТМГ, этого достаточно. В каждой си- 
туации очистка данных имеет свои особенности, поэтому всегда отводите немно- 
го времени на то, чтобы определить допустимые и недопустимые данные. Меха- 
низм проверки меченых данных служит для перехвата глупых ошибок и не отме- 
няет необходимости думать. 


Наведение порядка в окружающей среде 


При запуске из сценария на Рей другой программы — неважно, каким образом, — 
Рег] проверяет, является ли безопасной переменная среды РАТН. Поскольку РАТН про- 
исходит из системного окружения, она сразу помечается, и при попытке запустить 
другую программу Рей возбуждает исключение “Тпзесиге $ЕММ{РАТН}". Если устано- 
вить РАТН равной известному немеченому значению, Рег! убедится, что все перечис- 
ленные в РАТН каталоги не доступны для записи никому, кроме владельца и груп- 
пы каталога; в противном случае Реп возбудит исключение “Тпзесиге бігесіогу". 


Вас может удивить, что Ре! интересуется вашей переменной РАТН, даже если вы 
задаете полное имя команды, которую вы хотите выполнить. Верно, что. если 
указано абсолютное имя, РАТН не используется для поиска выполняемого модуля. 
Но вы не можете быть уверены, что запускаемая программа не развернется на 
180 градусов и не запустит другую программу, с которой возникнут неприятности 
из-за незащищенной РАТН. Поэтому Рег! требует установить надежное значение 
РАТН, прежде чем вызывать какую-либо программу каким бы то ни было способом. 


РАТН — не единственная переменная среды, способная доставить огорчения. По- 
скольку некоторые интерпретаторы команд используют переменные ТЕ$, СОРАТН, 
ЕМУ и ВАЗН_ЕММ, Ре] проверяет, что все они пусты либо не помечены перед тем, как 
запустить другую команду. Либо назначьте этим переменным безопасные значе- 
ния, либо вообще удалите из окружения: 
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Че1ете @ЕМ/{ди(ТЕЗ СОРАТН ЕМУ ВАЗН_ЕМ\)}; # Сделайте ЖЕМ безопаснее 


Возможности системы, удобные в обычной среде, могут стать проблемой для за- 
щиты данных во враждебной среде. Даже если вы не забываете запрещать имена 
файлов, содержащие символы перевода строки, важно помнить, что ореп обраща- 
ется не только к именованным файлам. Если надлежащим образом декорировать 
аргумент с именем файла, вызовы ореп с одним или двумя аргументами могут за- 
пускать произвольные внешние программы через каналы, ответвлять дополни- 
тельные экземпляры текущего процесса, дублировать дескрипторы файлов и ин- 
терпретировать специальное имя файла «-» как псевдоним стандартного ввода 
или вывода. Они могут также игнорировать ведущие и замыкающие пробельные 
символы, что скроет такие необычные аргументы от ваших проверочных шабло- 
нов. Механизм проверки меченых данных в Ре! действительно перехватывает 
меченые аргументы, используемые при открытии конвейеров (если только не ис- 
пользуется отдельный список аргументов) и файлов (если файл открывается не 
только для чтения), но возбуждаемые при этом исключения могут нарушить нор- 
мальное выполнение вашей программы. 


Если в качестве имени открываемого файла вы собираетесь использовать данные, 
полученные извне, хотя бы включите явно через пробел режим открытия. Одна- 
ко безопаснее всего, по-видимому, использовать низкоуровневую ѕуѕореп или фор- 
му ореп с тремя аргументами: 


# Волшебное открытие - может быть любым 
ореп(ЕН. $Р11е) Н| діе “невозможно волшебно открыть $#і1е: $! “; 


# Гарантирует открытие файла только для чтения и исключает открытие канала 

# или запуск порожденного процесса, но все же принимает дескрипторы файлов и “~, 
# и игнорирует пробельные символы с обоих концов имени. 

ореп(ЕН, "< $#11е”) || діе "невозможно открыть $#і1е' $! "; 


# МҮЅІМҮб-открытие: отключает все удобные функции 
ореп(ЕН. “<”. $Е1е) || діе “невозможно открыть $Р11е $'”; 


# Те же свойства, что в 3-аргументной версии МҮЅІМҮС 
гедиіге Еспї]; 
ѕуѕореп(ЕН, $111е, 0 ВООМҮ) || діе “невозможно ѕуѕореп $#:1е: $!" 


Даже этих шагов не вполне достаточно. Рей не препятствует открытию файлов 
с мечеными именами в режиме чтения, поэтому следует проявлять осторожность, 
показывая их содержимое людям. Программа, которая открывает файл с произ- 
вольным именем, указанным пользователем, и показывает его содержимое, пред- 
ставляет: собой угрозу безопасности. А если это личное письмо? А если это систем- 
ный файл с паролями? А если это данные о зарплате или о вашем портфеле цен- 
ных бумаг? 


Изучите внимательно имена файлов, полученные от потенциально враждебного 
пользователя,! прежде чем открывать их. Например, можно проверить отсутст- 
вие в пути подлых составляющих каталогов. Известными трюками такого сорта 
являются имена типа «../../../../../../../еѓс/раѕѕшӣ». Защититься можно, проверив от- 
сутствие косой черты в имени (если она служит разделителем каталогов в вашей 


1 АвСети единственными пользователями, которых вы можете не считать потенциаль- 
но враждебными, являются активно враждебные пользователи. 
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системе). Часто также используется прием включения символов перевода строки 
или точки с запятой в имя файла, в результате чего какой-нибудь несчастный 
глупый интерпретатор командной строки может принять их за начало новой ко- 
манды посреди имени файла. Именно поэтому в режиме проверки меченых дан- 
ных отвергаются непроверенные внешние команды. 


Доступ к командам и файлам 
с ограниченными привилегиями 


Последующее изложение касается некоторых ловких приемов, относящихся к без- 
опасности в ОМІХ-подобных системах. Пользователи других систем могут спо- 
койно пропустить этот раздел (хотя навряд ли это будет безопасно). 


Если сценарий запущен как ѕеі-ій, постарайтесь по возможности выполнять 
опасные операции с правами пользователя, а не программы. То есть, собираясь 
применить ореп, зузореп, зузтет, обратные апострофы или другие операции с фай- 
лами или процессами, защитите себя, установив текущие ОТО или СТО равные 
реальным Лр или СПО. В сценариях ѕебшіа это можно сделать, сказав $> = $< (или 
ФЕИТО = $010 в области действия прагмы изе Епд1131), а в сценариях ѕеіеій, сказав 
$( = $) ($ЕСІр = $610). Если установлены оба идентификатора, следует изменить 
оба. Однако иногда это невозможно, поскольку расширенные права доступа мо- 
гут все же понадобиться вашей программе позже. 


Для таких случаев Регі поддерживает достаточно надежный способ открытия 
файла или канала из программы зеё-а. Во-первых, следует породить процесс 
с помощью особого синтаксиса ореп, связывающего родительский и порожденный 
процессы через канал. Во-вторых, в порожденном процессе установить Г пользо- 
вателя и группы в исходные или заведомо безопасные значения. Можно также из- 
менить атрибуты порожденного процесса, не затрагивая родительский, что по- 
зволит изменить рабочий каталог, установить маску создания файла и перемен- 
ные среды. Наконец, лишившись дополнительных прав доступа, порожденный 
процесс вызывает ореп и передает любые данные, доступные от имени простого, 
но слабоумного пользователя, своему могущественному, но по справедливости 
параноидальному родителю. 


В то время как ѕуѕїеп и ехес не используют интерпретатор команд, получив более 
одного аргумента, оператор обратных апострофов не имеет такого альтернативно- 
го соглашения по вызову. С помощью приема ветвления легко можно эмулиро- 
вать обратные апострофы, не опасаясь их обработки интерпретатором команд, 
и с пониженными (а потому более безопасными) правами доступа: 


изе Епд11ѕћ, # чтобы использовать $010 и прочие 
діє “Невозможно породить через ореп: $!" ип1езз деѓ1пед($р1а = ореп(ЕВОМКТО, ^-|“)); 
1Ё ($р19) { # родитель 
мһі1е (<ЕВОМКТО>) { 
# какие-то действия 
} 
сІоѕе ҒАОМКІР; 
} 
е15е { 
ФЕШІр = $010; # ѕеїиіа(деїџід()) 
ФЕСТО = $610; # ѕеїдіа(деїдіа()), и іпіїдгоџрѕ(2) по деїдгоирѕ(2) 
сһаїг("/"°) || діе "невозможно сһаіг в /: $1”; 
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итазк(077); 

ФЕММ{РАТН} = "/ріп: /оѕг/б1п” 
ехес “тургод”, “агд1”, "агд2“; 
діе “невозможно ехес пургод: $1”, 


} 


Этот способ вызова программ из сценария ѕеї-іа превосходит все остальные. Он 
гарантирует, что интерпретатор команд не будет использоваться для выполнения 
чего-либо и обеспечит понижение привилегий перед запуском программы. (Но 
из-за того, что списочные формы ѕуѕїеп, ехес, а также форма ореп, открывающая 
канал, не подвергаются проверке чистоты аргументов, все же следует проявлять 
осторожность в отношении того, что вы передаете.) 


Если потребуется сохранить права доступа и реализовать обратный апостроф 
или открытие канала, не опасаясь перехвата интерпретатором команд ващих ар- 
гументов, можно использовать такой код: 


ореп( ЕВОМКІР, “-|”) || ехес("тургод”, "агу1“, "агд2") 
|| діе “невозможно выполнить турго: $! ": 


а затем просто читать из ҒАОМКІР в родительском процессе. Начиная с Регі версии 
5.6.1, это можно выразить так: 


ореп(ЕВОМКІР, “-|”, “тургод”, “агд1", “агд2"); 


Прием ветвления удобно использовать не только для запуска команд из программ 
5е6-14. Его можно применять и для открытия файлов с правами пользователя, кото- 
рый запустил программу. Допустим, что у вас есть программа зей ца, которой нуж- 
но открыть файл для записи. Вы не хотите выполнять ореп с дополнительными 
правами доступа, но окончательно потерять их вы тоже не можете. В таком случае 
запустите порожденную копию, которая отбросит дополнительные права и вы- 
полнит ореп в пользу основной программы. Если потребуется выполнить запись 
в файл, передайте данные порожденному пронессу, а уже он запишет их в файл. 


џѕе Епо1іѕпћ, 


деғіпеа (%$ріа = ореп(ЅАҒЕ_МВІТЕВ, “|-”)) 
|| діе “Невозможно ветвление: $": 


11 ($р19) { 
# родитель, передать данные дочернему процессу через ЗАРЕ _МАТТЕВ 
ргіпі ЗАРЕ МЯТТЕЯ “ёоџїриї_дата\п 
с1оѕе ЗАРЕ _МАТТЕЕ 
|| 91е $! ? "Зузегг при закрытии ЗАРЕ МВТТЕВ: $' 
° "Статус ожидания $? от ЗАЕЕ МАІТЕВ” 
} 
е15е { 
# дочерний процесс. отменить дополнительные права 
(ФЕ0ІЮ, $ЕбТО) = (ФИТО, $610); 


# открыть файл с правами исходного пользователя 
ореп(ЕН, “> /ѕоте/Ғі1е/раїћ”) 
|| діе "невозможно открыть /зоте/Ре/раЕН для записи: $!" 


# копировать от родителя (теперь это ѕїдіп) в файл 
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мһі1е (<5Т0ІМ) { 
ргіпі ЕН $; 
} 
с1оѕе(ЕН) || діе “ошибка при закрытии: $! “; 
ехії; Не забудьте сделать так, чтобы ЗАРЕ МАІТЕВ исчез. 


} 


Если файл открыть невозможно, порожденный процесс выведет сообщение об 
ошибке и завершит работу. Если родительский процесс попытается вывести дан- 
ные в недействительный теперь дескриптор файла в порожденном процессе, то 
получит сигнал разрушения канала (5ІСРІРЕ), который фатален, если не перехва- 
тывается или игнорируется. См. раздел «Сигналы» в главе 15. 


Обход режима проверки меченых данных 


Режим проверки меченых данных — это инструмент разработчика, помогающий 
обнаруживать данные, требующие очистки. Он не является абсолютной гаран- 
тией от неприятностей, поэтому неприятности все же возможны. Фактически 
этот режим можно легко обойти. 


Ключ командной строки -Т обеспечивает принудительную проверку меченых 
данных, и его можно добавить в строку #! в вашем сценарии: 


#1 /иѕг/біп/рег1і -Т 


ѕуѕтет ‘еспо’, ФАВСМ[0]; 


Если попытаться запустить такой сценарий из командной строки без ключа -Т, 
он завершится ошибкой: 


% рег1 еспо.р1 
"-Т" 13 оп їһе #! 1іпе, ії пизф а150 бе изед оп Тһе соттапа 11пе 
(ключ "-Т" присутствует в строке #!, он также должен быть указан в командной строке; 


Коварный пользователь может включить режим проверки меченых данных, но 
превратить обычно фатальные сообщения в предупреждения. Ключ -ї включает 
режим проверки меченых данных, но в этом случае при нарушениях режима будут 
выводиться только предупреждения. Система сможет принимать меченые данные: 


х рег? -Е есһо.р1 Ате1іа 

Іпѕесиге ФЕМУ{РАТН} мһі1е гиппіпо міїћ -Е зил сп 

Іпѕесиге дерепдепсу іп ѕуѕет мһі1е гипп1пд міїћ -1 ѕміїсп 
Іпѕесиге ФЕМУ{РАТН} мһі1е гиппіпо міїћ -Е ѕміїсћһ 

Апе1іа 


Если запускается сценарий ѕеёиіа и режим проверки меченых данных включает- 
ся автоматически, его также можно обойти с помощью ключа -ѓ: 


Х рег] -Е өспо.р1 Ате1іа 

Іпѕесиге ФЕМУ{РАТН} мћі1е гиппіпо міїћ -—+ ѕміїсһ 

Іпѕесиге дерепаепсу іп ѕуѕїет мһі1е гиппіпо міїћ -Е эм си 
Тпзесиге ФЕМУ{РАТН} мћі1е гиппіпо міїһ -1 ѕміїсһ 

Апе1іа 


Аналогично, ключ -7 разрешает регі выполнять «небезопасные» операции, но 
при этом все еще требуется указать ключ -Т: 
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Х рег1 -ТЦ есһо.р1 Ате1іа 
Апе11іа 


Если потребуется вернуть предупреждения на место, используйте -ш: 


Х рег1 -Т\/ -м есһо.р1 Ате11а 

Іпѕесиге $ЕМУ{РАТН} мһі1е гиппіпо міїһ -+ зм1 {сп 

Тозесиге дерепаепсу іп ѕуѕіет мһі1е гипптпд міїћһ -Е ѕміїсһ 
Тпзесиге ФЕМУ{РАТН} ми11е гипп1пд міїћ -+ ѕміїсһ 

Ате]1а 


Программисты способны обойти режим проверки меченых данных, но не приемы 
по очистке данных, которые были показаны выше. Например, ниже представле- 
на операция сопоставления, совпадающая со всем чем угодно: 


ту Фиптатпеед = $тазптед =- п/(. *)/; 


Ее легко заметить, читая исходный текст программы, поэтому коварный пользо- 
ватель сумеет передать данные через хеш. Поскольку понятие «меченых данных» 
применяется к скалярным переменным, ключи хеша не будут считаться мечены- 
ми. Поэтому использование скалярной переменной в качестве ключа хеша помо- 
гает устранить все волшебство: 


пу (ипїаіпіей) = кеуѕ %{ { Фипфаллеед => 1 } }; 


О подобных приемах можно рассказывать часами. Другие ухищрения можно 
найти в главе «Зесиге Ргоргаттіпе Тесһпіасоеѕ» книги «Мавіегіпе Рег». 


Обработка ошибок синхронизации 


Иногда работа вашей программы очень чувствительна к неподвластному вам рас- 
писанию внешних событий. Это всегдг проблема, когда другие программы, в осо- 
бенности враждебные, соперничают с вашей программой за одни и те же ресурсы 
(например, файлы или устройства). В многозадачной среде невозможно предска- 
зать порядок, в котором процессы, ожидающие своей очереди выполнения, полу- 
чат доступ к процессору. Потоки команд возможных процессов чередуются, поэто- 
му сначала один процесс получает несколько циклов центрального процессора, 
затем другой процесс и т.д. Очередность выполнения и отводимое на него время 
кажутся случайными. Если программа одна, то проблем не возникает, в отличие 
от ситуации, когда несколько программ совместно используют общие ресурсы. 


Особенно чувствительны к таким вопросам программисты, создающие многопо- 
точные программы. Они быстро усваивают, что нельзя говорить: 


$уаг++ 1 $уаг == 0; 
когда нужно сказать: 


{ 
1оск($уаг); 
$\аг++ 11 $уаг == 0; 


} 


В первом случае получаются непредсказуемые результаты, если несколько пото- 
ков попытаются одновременно выполнить этот код. Если совместно используе- 
мыми объектами являются файлы, и процессы, подобно потокам, соперничают 
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за доступ к ним, возникают такие же проблемы. Процесс, в конце концов, – это 
в некотором отношении лишь поток. Или наоборот. 


Непредсказуемость во времени влияет на любые ситуации, привилегированные 
и непривилегированные. Сначала рассмотрим, как справиться с давней ошибкой 
в старых ядрах ОМІХ, проявляющейся в программах 564-14. Затем перейдем к об 
суждению состояний гонок (гасе сопаіёіопѕ) в целом, того, как они могут превра- 
щаться в бреши в системе защиты, и действий, помогающих этого избежать. 


Ошибки защиты в ядре УМХ 


Помимо очевидных проблем из-за особых прав, что даются таким гибким и непро- 
ницаемым интерпретаторам, какими являются интерпретаторы команд, в старых 
версиях ОМТХ в ядре имеется ошибка, которая делает небезопасными все сцена- 
рии ѕеі-1ӣ еще до того, как они попадут интерпретатору. Проблема состоит не в са- 
мом сценарии, а в ситуации, возникающей при обнаружении ядром сценария ѕеі-іа 
для выполнения. (Этой ошибки нет в системах, ядро которых не распознает #!.) Ко- 
гда ядро открывает такой файл, чтобы узнать, какой интерпретатор нужно запус- 
тить, возникает некоторая задержка, прежде чем запустится интерпретатор (те- 
пере зе{-19) и откроет этот файл. Эта задержка дает возможность злоумышленнику 
изменить файл, особенно если система поддерживает символические ссылки. 


К счастью, иногда эту «возможность» ядра можно отключить. К несчастью, сде- 
лать это можно разными способами. Система может запретить сценарии с уста- 
новленными битами зе 14, что не очень удобно. Кроме того, она может игнориро- 
вать биты ѕеі-ій у сценариев. В последнем случае Регі может эмулировать меха- 
низм ѕеѓиіа и зеієіа, обнаружив биты зѕеі-іа (в другом отношении бесполезные) 
у сценариев Рег1. Делает он это с помощью особого исполняемого модуля ѕиіарегі, 
который при необходимости вызывается автоматически! Однако если в ядре не 
отключена функция сценариев ѕеі-іӣ, Регі начинает громко жаловаться, что дан- 
ный сценарий ѕеёџійа небезопасен. Придется либо отключить в ядре поддержку 
сценариев ѕеі-ій, либо поместить сценарий в С-обертку. С-обертка — это просто 
скомпилированная программа, единственным действием которой является вызов 
вашей программы на Рей. Скомпилированные программы не подвержены дейст- 
вию той ошибки ядра, от которой страдают сценарии ѕеі-ід. 


Вот простая обертка, написанная на С: 


#аеғіпе НЕА ЕЕ “ /ратћ/+о/5сгірї” 
таіп(ас, ау) 
сһаг **ау; 


ехесу(ВЕАІ_ ЕЕ. ау): 
} 


Скомпилируйте ее в исполняемый образ и запускайте вместо своего сценария 
ѕеі-іа. Используйте абсолютное имя файла, так как С недостаточно сообразите- 
лен, чтобы проверять меченые данные по вашей переменной РАТН. 


При необходимости и разрешении на это. Если Рег| обнаружит, что файловая система, 
в которой находится сценарий, смонтирована с параметром по$и19, это значение будет 
соблюдаться. Здесь нельзя использовать Регі, чтобы обойти политику защиты данных 
вашего системного администратора. 
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Другой возможный подход состоит в применении экспериментального генерато- 
ра кода С в компиляторе Рен. В скомпилированном образе вашего сценария веро- 
ятность состояния гонки исключается (см. главу 16). 


В последние годы наконец стали поставляться системы с исправленной ошибкой 
5е4-14. В этих системах при передаче интерпретатору имени сценария зе{-14 боль- 
ше не используется имя файла, которое можно подделать, а передается особый 
файл, представляющий дескриптор файла, например /де0о//а/3. Этот особый 
файл уже открыт для сценария, поэтому состояния гонки не могут возникать и, 
соответственно, использоваться злонамеренными сценариями.’ Самые последние 
версии ОМІХ используют такой подход, чтобы избежать состояния гонки, возни- 
кающего при открытии одного и того же имени файла дважды. 


Обработка состояний гонки 


Вот мы и подошли к теме состояний гонок (гасе соп@1опз). Что же это за состоя- 
ния? Они часто всплывают при обсуждении проблем защиты данных. (Хотя и ре- 
же, чем в небезопасных программах. К несчастью.) Дело в том, что они служат 
обильным источником тонких программных ошибок, а такие ошибки часто ста- 
новятся основой подвигов на ниве проникновения (если вежливо назвать таким 
словом взлом системы защиты данных). Возникает состояние гонки, когда ре- 
зультат нескольких взаимосвязанных событий зависит от порядка их возникнс- 
вения, но этот порядок нельзя гарантировать из-за недетерминированных вре- 
менных эффектов. Каждое событие стремится осуществиться первым, а о конеч- 
ном состоянии системы можно только гадать. 


Представьте, что имеется один процесс, который перезаписывает существующий 
файл, и другой процесс, который читает тот же самый файл. Нельзя предсказать, 
что вы прочтете: старый файл, новый файл или случайную смесь их обоих. Неиз- 
вестно даже, все ли данные будут прочитаны. Читающая программа может выиг- 
рать гонку, прочесть файл до конца и завершить работу. Тем временем пишущая 
программа продолжит работу уже после того, как читающая программа напла 
конец файла, файл продолжится далее того места, где было прекращено его чте- 
ние, а читающая программа об этом не узнает. 


В данном случае решение простое: обе стороны должны заблокировать файл с по- 
мощью 110ск. Обычно читающая программа запрашивает блокировку с совмест- 
ным доступом, а пишущая — с монопольным. Если все стороны запрашивают эти 
рекомендованные блокировки и соблюдают их, то чтение и запись не будут пере- 
межаться и данные не исказятся. См. раздел «Блокировка файлов» главы 15. 


Менее очевидная форма состояния гонки может возникнуть, когда операции над 
именем файла управляют последующими операциями над этим файлом. Когда 
операторы проверки файлов осуществляются с именами файлов, а не с их дескрип- 
торами, это прямая дорога к возникновению состояния гонки. Рассмотрим такой 
код: 
ТЕ (-е $ҒіЈе) { 
ореп(ЕН, “<”, $Р11е) 


1 В этих системах нужно компилировать Рег| с ключом -РБЕТОІР”р 5СЕ!РТ5_АВЕ_ 
ЅЕСОВЕ МОМ. Программа Сопйвиге, которая собирает Рей, старается самостоятель- 
но определить потребность в этом ключе, чтобы вам не пришлось этим заниматься. 
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|| діе “невозможно открыть $#і1е для чтения $! "; 
} 
е1ѕе { 
ореп(ЕН, “>”, $#1е) 
|| діе “невозможно открыть $#і1е для записи: $!"; 


} 


Этот код кажется тривиальным и, тем не менее, может вызвать состояние гонки. 
Нет никакой гарантии, что результат выполнения проверки -е все еще будет дей- 
ствителен в том или ином вызове ореп. Другой процесс может удалить файл, пре- 
жде чем удастся его открыть в блоке 11, и файл, который, как вам казалось, дол- 
жен быть на месте, найден не будет. Другой процесс может создать файл, прежде 
чем второй вызов ореп в блоке е15е получит возможность создать файл, и файл, 
которого, как вам казалось, не существует, окажется там. Простая функция ореп 
создает новые файлы, но перезаписывает существующие. Допустим, вы решили 
перезаписать некоторый существующий файл, но что если этот файл является 
вновь созданным псевдонимом или символической ссылкой на другой файл в сис- 
теме, который вам очень не хотелось бы перезаписать? Можно считать, что значе- 
ние каждого имени файла в каждый данный момент известно, но в действитель- 
ности в этом никогда нельзя быть уверенным, если в системе выполняются дру- 
гие процессы с правом доступа к каталогу, содержащему этот файл. 


Чтобы решить описанную проблему, нужно использовать функцию зузореп, кото- 
рая позволяет отдельно управлять тем, нужно ли создавать новый файл и можно 
ли разрушить существующий. И мы откажемся от проверки существования фай- 
ла -е, поскольку она не приносит здесь никакой пользы, а только увеличивает 
шансы попасть в состояние гонки. 


изе РспЕТ дм/0_МАОМІҮ 0_СВЕАТ 0_ЕХСІ/; 

ореп(ЕН, “<”, $ғ11е) 
|| ѕуѕореп(ҒН, Ф?і1е, 0 МВОМҮ | 0_СВЕАТ | О ЕХСІ) 
|| 91е “невозможно создать новый файл ФҒі1е: $!” 


Теперь, даже если файл каким-то образом возникнет в промежутке времени меж- 
ду отказом ореп и попыткой зузореп открыть новый файл для записи, никакого 
вреда не будет, потому что с данными флагами ѕуѕогё п не станет открывать суще- 
ствующий файл. 

Если кто-то попытается заставить вашу программу дурно себя вести, весьма веро- 
ятно, что он будет делать это, создавая и уничтожая файлы, когда вы этого не ожи- 
даете. Один из способов снизить риск быть обманутым состоит в том, чтобы дать 
себе слово никогда не выполнять операции над файлом с одним и тем же именем 
больше одного раза. Как только вы открыли файл, забудьте его имя (вспоминая, 
может быть, только в сообщениях об ошибках) и работайте только с дескрипто- 
ром, представляющим файл. Это значительно безопаснее, так как даже если кто- 
то сможет манипулировать именами ваших файлов, делать это с дескрипторами 
он не сумеет. (Только если вы дадите ему разрешение — см. раздел «Передача де- 
скрипторов файлов» в главе 15.) 


Ранее в этой главе мы продемонстрировали функцию һапд1е 100к5_ѕаѓе, которая 
вызывала функцию Рег] ѕїаї с дескриптором (не именем) файла для проверки 
владельца и прав доступа к файлу. Использование дескриптора файла важно для 
корректности: если бы мы работали с именем файла, не было бы никакой гаран- 
тии, что файл, атрибуты которого исследовались, тот же самый, что и только что 
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открытый (или который собирались открыть). Какой-нибудь злоумышленник 
мог удалить файл и быстро подменить его своим с какой-нибудь гадостью в некий 
момент между вызовами ѕїаї и ореп. Неважно, которая из них вызывается пер- 
вой; возможность нечестной игры в перерыве между вызовами в любом случае со- 
храняется. Кто-то может счесть риск пренебрежимо малым, ведь промежуток 
времени так короток, однако существует множество сценариев взлома, которые 
будут рады запустить вашу программу тысячу раз, чтобы поймать единственный 
случай, когда она окажется недостаточно осторожной. Толковый сценарий взло- 
ма может даже понизить приоритет программы, чтобы она прерывалась чаще, 
и несколько ускорить события. Люди напряженно работают над такими вещами, 
поэтому их и называют подвигами (ехріоіїз). 


Вызывая ѕїат с уже открытым дескриптором файла, мы используем имя файла 
только один раз и поэтому избегаем состояния гонки. Хорошей стратегией для 
устранения гонки между двумя событиями является их объединение в одну опе: 
рацию атомарного характера.' Поскольку мы обращаемся к файлу по имени толь- 
ко один раз, ситуация гонки в промежутках между несколькими обращениями 
не возникает, поэтому не важно, изменится ли имя. Даже если взломщик удалит 
открытый нами файл (да, бывает и такое) и подменит его другим, чтобы обмануть 
нас, мы сохраним дескриптор исходного файла. 


Временные файлы 


Помимо выходов за пределы буферов (которым сценарии Рег! практически не под- 
вержены) и доверия не заслуживающим того входным данным (защитой от чего 
служит режим проверки меченых данных), некорректное создание временных 
файлов является одной из наиболее часто используемых брешей в системе защи- 
ты. К счастью, атака на временные файлы обычно требует от взломщиков нали- 
чия законной учетной записи пользователя, что существенно сокращает число 
потенциальных негодяев. 


Часто по небрежности программы используют временные файлы различными 
небезопасными способами, например помещают их в каталоги, доступные для за- 
писи кому угодно, используют легко угадываемые имена и не проверяют сущест- 
вование файла с тем же именем. Если вы обнаружите в программе такой код: 


ореп(ТМР, “> /1тр/Роо. $$") 
|| діе "сап'ї ореп /тир/Роо. $$ $! 


знайте, что столкнулись сразу со всеми тремя перечисленными ошибками. Эта 
программа просто напрашивается на неприятности. 


Взломщик может подбросить файл с тем же именем, которое вы собираетесь ис- 
пользовать. Добавление РШ процесса в конец имени не является достаточным 
для уникальности - как это ни удивительно, угадать РІР совсем не трудно.? В ре- 


1 Да, операции над атомами можно проводить и в безъядерной зоне. Когда Демокрит на- 
звал «атомами» невидимые частицы вещества. он буквально имел в виду нечто неде- 
лимое: 6- (не) + -тонос (делимый). Атомарная операция - это действие, которое нельзя 
прервать. (Попробуйте как-нибудь прервать атомную бомбу.) 


2 Если только у вас не система типа ОрепВБО, которая назначает новые РШ случайным 
образом. 
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зультате программа с неосторожным вызовом ореп уже не создаст временный 
файл для собственных целей, а перезапишет файл взломщика. 


Так какой вред это может причинить? Разнообразный. Файл взломщика может 
оказаться не простым файлом, а символической ссылкой (а иногда и жесткой 
ссылкой), указывающей на некоторый важный файл, недоступный взломщику 
для записи, например /еѓс/раѕѕшаӣ. Программа считает, что открыла в /йтр совер- 
шенно новый файл, но на самом деле она разрушила существующий файл в ка- 
ком-то другом месте. 


В Рен есть две функции, которые при правильном применении помогут решить эти 
проблемы. Первая из них — Р05ІХ::їпрпап, возвращающая имя открываемого файла: 


# Перебирать имена. пока не получим совершенно новое. 
изе РОЅІХ; 
до { 
фпате = ©трпат( ), 
} ипіі1 ѕуѕореп(ТМР, $пате, О_АРМА | О СВЕАТ | 0 ЕХСІ, 0600); 
# Теперь можно осуществлять ввод/вывод с помощью дескриптора ТМР 


Вторая — І0::Ғі1е::пем_їпрғі1е, возвращающая дескриптор уже открытого файла: 


# Или позволить модулю сделать это вместо нас. 

иѕе 10: :Ғі1е; 

пу $#һ = І0::Рі1е: : пем Етрғі1е(); # это РОЗТХ-функция їтрѓі1е(3) 
# Теперь можно осуществлять ввод/вывод с помощью дескриптора $#ћ 


Ни тот ни другой методы не совершенны, но первый предпочтителен. Основной 
недостаток второго способа заключается в том, что Рег! зависит от слабостей реа- 
лизации ипр/Ие(3) в системной библиотеке С, и нет никаких гарантий, что эта 
функция не делает чего-либо столь же опасного, как ореп, которую мы пытаемся 
исправить. (А некоторые, к сожалению, делают.) Менее существенная проблема 
в том, что эта функция вообще не возвращает имя файла. Хотя лучше будет, если 
вы сможете работать с временным файлом без имени, поскольку в результате вы 
не спровоцируете состояние гонки его повторным открытием. но часто без имени 
работать невозможно. 


Первый способ плох главным образом тем, что не позволяет указать каталог для 
размещения временного файла, как функция тёзѕіетр(8) из библиотеки С. Во- 
первых, крайне нежелательно, чтобы файл оказался в сетевой файловой системе. 
Флаг 0_ЕХСІ не гарантирует правильной работы в сетевой файловой системе, по- 
этому несколько процессов, запросивших монопольное создание примерно в одно 
время, могут коллективно преуспеть в этом. Во-вторых, поскольку каталог может 
оказаться доступным для записи другим, у злоумышленника есть возможность 
подкинуть символическую ссылку на несуществующий файл, что заставит про- 
грамму создать файл в месте, выбранном не вами.! Если необходимо что-то сохра- 
нить во временных файлах, не помещайте их в каталог, доступный для записи 
всем. При необходимости используйте флаг 0_ЕХСЕ в зузореп и постарайтесь рабо- 
тать с каталогами, для которых установлен флаг «удаляет только владелец» – так 
называемый «липкий» (ѕііску) бит. 


* Решением в некоторых операционных системах является вызов зузореп с флагом 


0 МҒОЦ ОМ. Это вызывает неудачу выполнения функции, если конечная составляющая 
пути является символической ссылкой. 
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В Рег] версии 5.6.1 появился третий путь. Стандартный модуль [11е: Тетр учиты- 
вает все сложности, о которых мы говорили. Например, можно использовать па- 
раметры по умолчанию: 


иѕе Е11е: :Тетр “тетрғі1е"; 
ФНап@1е = +етрғ11е(); 


Или определить некоторые из них: 


цъе Рі1е: :Тетр "Тетрғ11е“; 

(ФһапдЛе, $ҒіЛепате) = Тетрғі1е( "рі ооһХХХХХХ”, 
ОТА => "/уаг/ѕроо! /айхепїиге”, 
ЅЏЕРІХ = ".даї”); 


Модуль Ее: Лепр предоставляет также безопасные версии других упомянутых на- 
ми функций (хотя родной интерфейс лучше, поскольку возвращает открытый де- 
скриптор файла, а не просто имя файла, подверженное состоянию гонки). См. бо- 
лее подробное описание параметров и семантики этого модуля. 


Получив дескриптор файла, с ним можно делать что угодно. Он открыт для чте- 
ния и записи, поэтому можно писать в дескриптор, перемещаться в начало файла 
и при необходимости перезаписывать то, что было только что записано или про- 
читано. Но чего действительно нужно избегать, так это повторного открытия то- 
го же файла, потому что нельзя быть уверенным, что это тот же самый файл, ко- 
торый был открыт в первый раз.! 


Когда вы запускаете из своего сценария другую программу, Рег! обычно закрыва- 
ет все дескрипторы файлов, чтобы прикрыть другую брешь в системе безопасно- 
сти. Если вы используете їспї1, чтобы сбросить флаг закрытия при ехес (как по- 
казано в конце описания ореп в главе 27), другие вызываемые программы насле- 
дуют этот новый дескриптор открытого файла. В системах, поддерживающих 
каталог /4ео/[а/, можно передать другой программе имя файла, в действительно- 
сти означающее дескриптор файла, построив его так: 


$муігіпате = “/деу/Ра/“ Ғі1епо(ТМР); 


Если необходимо только вызвать подпрограмму или программу Регі, которые рас- 
считывают получить в качестве аргумента имя файла, и вы знаете, что эта под- 
программа или программа вызывают для его открытия обычную функцию ореп, 
можно передать дескриптор с использованием обозначений Рег] для дескриптора 
файла: 


$уігіпапе = “=&” . ҒіЛепо(ТМР); 


Если такое «имя» передать обычной функции ореп с одним или двумя аргумента- 
ми (но не тремя; третий лишает силы это полезное волшебство). вы получите дос- 
туп к дубликату дескриптора. В некоторых отношениях такая конструкция более 
переносима, чем передача файла из /4ео/[а/, поскольку она работает везде, где ра- 
ботает Рег1, а не только в системах, где есть каталог /део/{а/. С другой стороны, 
такой специальный синтаксис ореп для доступа к дескрипторам файлов по номеру 


1 Можно вызвать ѕіаї для каждого дескриптора и сравнить полученные значения (пары 
деу1сеЛподе). Но тогда будет уже слишком поздно, потому что повреждения уже нане- 
сены. Все, что можно сделать, – это обнаружить ущерб и произвести аварийный выход 
(и, может быть, послать письмо системному администратору). 


Работа сненадежным кодом 637 


работает только с программами Рег и не работает с программами, написанными 
на других языках. 


Работа с ненадежным кодом 


Механизм меченых данных — это лишь защитный барьер перед фальшивыми дан- 
ными, которые вы должны были бы перехватить сами, но не позаботились об этом 
и передали их в систему. Он напоминает необязательные предупреждения, кото- 
рые умеет выдавать Рег! – они не всегда свидетельствуют о настоящей проблеме, 
но в среднем потери от реакции на ложную проблему меньше потерь от отсутствия 
реакции на настоящую. Что касается меченых данных, потери второго рода еще 
более заметны, поскольку фальшивые данные не просто дают неправильный от- 
вет, они могут загубить систему и пару предыдущих лет работы. (А может быть, 
и пару последующих лет, если вы не сделали хороших резервных копий.) Режим 
проверки меченых данных полезен, когда вы уверены, что написали качествен- 
ный код, но не очень верите тем, кто снабжает вас данными, и допускаете, что они 
обманным путем могут попытаться вовлечь вас в нечто крайне нежелательное. 


Данные – это одна сторона вопроса. Совсем другая сторона ~ когда вы не доверяе- 
те даже коду, который выполняете. А что если вы загрузите из Сети приложение 
с вирусом, или бомбу с часовым механизмом, или Троянского коня? Проверка ме- 
ченых данных при этом будет бесполезна, потому что загруженные данные могут 
быть прекрасными; не вызывает доверия сам код. Вы ставите себя в такое же по- 
ложение, как при получении от незнакомого человека неизвестного устройства 
с запиской, где сказано: «Просто приложите это к голове и потяните за курок». 
Возможно, вы решите, что это устройство для сушки волос, но вы недолго будете 
так думать. 


В этой области осторожность является синонимом паранойи. Что вам нужно, так 
это система, позволяющая поместить подозрительный код в карантин. Код про- 
должит существовать и даже будет выполнять некоторые операции, но он не смо- 
жет лазать всюду и делать что заблагорассудится. В Ре! такого рода карантин 
можно осуществить с помощью модуля Ѕаѓе. 


Изменение корневого каталога 


Функция сһгоої в Ре действует точно так же, как системный вызов сћгоо{(2). 
Она изменяет корневой каталог, вследствие чего программа лишается возможно- 
сти получать доступ к файлам за пределами сегмента файловой системы, выде- 
ленного для работы. Однако только суперпользователь гооё может воспользовать- 
ся этой функцией, а это уже проблема безопасности: 


сһгоої( ‘/изг/1оса1/араспе/аата” ); 
сһдіг( ‘/’); # теперь в /изг/Лоса1/араспе/дата 


В действительности это не закрывает доступ к файлам, находящимся за предела- 
ми нового корневого каталога. Если до вызова сһгоої был получен дескриптор ка- 
талога, его можно использовать для возврата к оригинальному корневому катало- 
гу даже при том, что вы не сможете использовать имя файла: 


и$е №5. 14; 
иѕе магпіпоѕ; 
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ѕау “Я здесь”, 
орепбіг му фгоофай. /’; 


сһгоої( `/Оѕегѕ/Ате1іа` }; 
орепдіг му $аһ, °`/’; # /0Оѕегѕ/Ате1іа 
ѕау Гог геадаіг($аһ); 


сһаіг( Фгооїаћ ); # Оп-ля, возврат к действительному '/' 
орепаз г ту ф@0һ, `. °; 
ѕау Ғог геаддіг($аһ); 


Возникновение такой ситуации требует вашего соучастия или соучастия другого 
человека. Если кто-то может отредактировать программу, добавив код, возвра- 
щающий программу в прежний корневой каталог, никакие защитные механиз- 
мы Рей не помогут. Используйте любые ухищрения, какие только сможете най- 
ти, чтобы исключить возможность запуска программы на Рег! с привилегиями 
суперпользователя. 


Защищенные разделы 


Модуль Ѕаѓе позволяет создать некий особый раздел — запафох (песочницу), в ко- 
тором перехватываются все системные операции и тщательно контролируется 
доступ к пространству имен. Низкоуровневые технические детали этого модуля 
находятся в процессе непрерывного изменения, поэтому мы предпочли более фи- 
лософский подход. 


Ограничение доступа к пространству имен 


В самых общих чертах объект Ѕаѓе напоминает сейф, только идея состоит в том, 
чтобы нехороших людей запирать внутри сейфа. В мире ОМІХ существует сис- 
темный вызов с именем сргооѓ(2), который может установить для процесса посто- 
янное ограничение, заставив его выполняться в некотором подкаталоге структу- 
ры каталогов, — создать для него, если хотите, маленький персональный ад. По- 
мещенный туда процесс лишен возможности обращаться к файлам, находящим- 
ся снаружи, поскольку не имеет способа назвать эти файлы.! 


Объект ЗаРе делает нечто похожее, только ограничивается не подмножеством 
структуры каталогов файловой системы, а подмножеством структуры пакетов 
Рей, которая тоже иерархична, как и файловая система. 


Можно и по-другому взглянуть на объект Ѕаѓе — как на специальную комнату с по- 
лупрозрачными зеркалами, в которую полиция помещает подозрительных типов. 
Снаружи в комнату заглянуть можно, но изнутри не видно, что делается снаружи. 


При создании объекта Ѕаѓе можно дать ему имя пакета. Если этого не сделать, но- 
вое имя будет выбрано за вас: 


иѕе Ѕа?ғе; 
пу $запабох = ЗаГе->пем( "Оипдеоп”); 
$0ипдеоп: : Ёоо = 1 # Однако прямой доступ не одобряется. 


1 Нанекоторых сайтах это делается для выполнения всех сценариев СОЇ, с применением 
«закольцованного» монтирования «только для чтения». Такая настройка требует уси- 
лий, но если кто-нибудь когда-нибудь сбежит, то обнаружит, что идти ему некуда. 
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К переменным и функциям пакета можно обращаться извне, если полностью ква- 
лифицировать их именем пакета, переданного методу пем, по крайней мере в теку- 


> 


щеи реализации. 


Несколько более совместимым с будущими реализациями может оказаться выпол- 
нение действий до создания Ѕаѓе, как показано ниже. Такой код наверняка сохра- 
нит работоспособность в будущем и представляет собой удобный способ настройки 
объекта баГе, который должен начинать работу с большим числом «состояний». 
(Мы согласны, что $Випдеоп: : Ёоо не является большим числом состояний.) 


иѕе баРе; 
$Бипдеоп: :пазфтег = ‘багу будах`; # Все еще прямой доступ, все еще не одобряется. 
ту $ѕапабох = ЗаРе->пем(“бипдеоп” ) 


Но Ѕаѓе предоставляет способ доступа к глобальным переменным раздела, даже 
если вы не знаете имени его пакета. Поэтому для максимальной совместимости 
в будущем (в ущерб скорости) мы рекомендуем метод ге\уа1: 


иѕе Ѕағе; 
пу $ѕапдбох = Ѕағе->пем(); 
Фѕапдрох->гема1( д($таѕтег = багу будах') ); 


(В действительности именно этот метод применяется для выполнения подозри- 
тельного кода.) Код, передаваемый в безопасный раздел для компиляции и вы- 
полнения, считает, что он на самом деле находится в пакете паіп. То, что внешней 
среде известно как $0иподеоп::таѕѓег, код внутри рассматривает как $паіп::таѕїег 
или $::паѕіег, или просто $паѕїег (если не включена директива изе ѕїгісї). Внутри 
раздела обращение $0иподеоп::таѕїег не будет работать, поскольку на самом деле 
оно будет обращением к $Бипдеон: :бипдеоп: :пазтег. Так как объект Ѕаѓе навязывает 
собственное представление о паіп, переменные и подпрограммы в остальной час- 
ти вашей программы оказываются защищенными. 


Чтобы скомпилировать и запустить код внутри раздела, вызовите метод геуа1 
(«геѕігіс+еа еуа1»), передав строку кода в аргументе. Как и в любой другой конст- 
рукции еуа1 578І№, ошибки компиляции и исключительные ситуации времени 
выполнения в геуа] не вызовут аварийное завершение вашей программы. Они 
просто прервут выполнение геуа1 и оставят исключительную ситуацию в пере- 
менной $0, поэтому обязательно проверяйте ее после каждого вызова ге\а]. 


С учетом произведенной ранее инициализации этот код выведет «тазфег теперь 
Рауе Агпезоп», но только если вы разрешите вызывать функцию ргіпі (см. сле- 
дующий раздел): 
$запдбох->реги11( дм(ргіпі) ); 
$запабох->ге\а1 ( 
9($тазтег = ‘`баме Агпезоп”; рглпф “тазтег теперь $тазп: : пазтег\п” 
); 
17 ($6) { 
діе "Невозможно скомпилировать код в разделе: $6” 


} 


Чтобы только скомпилировать код, не выполняя его, заключите строку в объяв- 
ление подпрограммы: 


фзапабох->геуа1 (а{ 
сиг Фтазтег; 
346 ѕау паѕ+ег { 
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ргіпї "таѕїег теперь $та1п: :пазфег\п“; 
} 
}, 1); 


91е і? $0; # проверка компиляции 


На этот раз мы передали ге\уа1 вгорой аргумент, который, будучи истинным, тре- 
бует от геуа1 компилировать код с директивой ѕігісї. Из самой же строки кода 
отключить ${г1с{ нельзя, потому что импорт и отмена импорта относятся к кате- 
гории операций, которые нельзя обычным образом выполнить в разделе Зате. 
В Ѕаѓе запрещено многое - см. следующий раздел. 


Если создать в разделе функцию ѕау наѕїе:, следующие строки будут действовать 
примерно одинаково: 


$ѕапӣрох->гема1("ѕау таѕїег()"); # Лучший способ. 
91е 1# $6; 


$ѕапабох->уагд100("ѕау_та»іет")->(); # Вызов через анонимную глобальную. 


бипдеоп: :ѕау_таѕїег(), # Прямой вызов, очень не одобряется 


Ограничение доступа к операторам 


Другая важная особенность объекта Ѕаѓе состоит в том, что Ре] ограничивает пе- 
речень операций, доступных в песочнице (зап ох). (Вы можете позволить сво- 
ему ребенку взять в песочницу ведерко и лопатку, но на базуку, вероятно, нало- 
жите запрет.) Недостаточно защитить оставшуюся часть программы, нужно за- 
щитить и оставшуюся часть компьютера. 


При компиляции кода в объекте Ѕаѓе с помощью гема] или гӣо (ограниченная вер- 
сия оператора 00 ҒПЕ) компилятор сверяется с особым списком управления досту- 
пом (он свой у каждого раздела), и проверяет допустимость компиляции каждой 
отдельной операции. Благодаря этому не нужно проявлять (особое) беспокойство 
относительно непредвиденных управляющих символов интерпретатора команд, 
незапланированного открытия файлов, странных утверждений с фрагментами 
кода в регулярных выражениях и большинства проблем с внешним доступом, по 
поводу которых обычно волнуются (или должны волноваться) разработчики. 


Если потребуется изменить перечень допустимых или запрещенных операций, 
можно напрямую сообщить разделу, какие операции разрешены или запрещены: 


иѕе %5. 10, 
$іпе = $ѕапабох->гема1( д(+іте) ), # действует 


фѕапдбох->депу( дм(©іте) ); 
фііпе = $ѕапабох->гема1( 9(11те) ) # ошибка 


Можно даже ограничивать доступ к целым группам операций, определяемым 
в модуле Орсоде (табл. 20.1), однако для этого необходимо знать внутреннее уст- 
ройство регі: 


$ѕапдбох->депу( дм( :баѕе_таїһ) ); 
пу $іте = $ѕапброх->гема1( `109(10)` ); # ошибка 


Вся хитрость состоит в том, чтобы защитить сам модуль 0рсойе так, чтобы экспор- 
тируемые им теги действительно соответствовали вашим ожиданиям. Если теги 
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не вызывают доверия, можно указать отдельные операции, имена которых при- 
водятся в описании модуля 0рсоде. Никогда и никому не доверяйте. 


Таблица 20.1. Отдельные теги групп операций из модуля Орсоае 


Тег Включает 

:раѕе, іо Операции ввода/вывода на основе дескрипторов файлов 

:дапдегоиз | Включает массу различных, потенциально опасных операций 

:Ғ11е8у5ѕ Ввод и вывод 

Лоаа Загрузка внешних файлов или получение информации о вызывающей про- 
грамме 

:5уѕ 00 Доступ к системной базе данных, такой как /еѓс/раѕѕша 


:5ибргосеѕѕ Создание порожденных процессов 


Модуль Ѕаѓе не предоставляет полной защиты от атак типа отказа в обслуживании 
(005 аНасК), особенно при использовании в менее ограниченных режимах. Атаки 
типа «отказ в обслуживании» захватывают все имеющиеся в системе ресурсы оп- 
ределенного вида, в результате чего другие процессы не могут получить доступ 
к важным системным средствам. Примерами таких атак служат переполнение таб- 
лицы процессов ядра, захват СРО с помощью жесткого бесконечного цикла, израс- 
ходование имеющейся памяти и переполнение файловой системы. Такие проблемы 
очень тяжело решать, особенно переносимым способом. Атаки типа «отказ в обслу- 
живании» рассматриваются в конце раздела «Код, маскирующийся под данные». 


Примеры использования модуля Ѕаѓе 


Представьте, что у вас есть программа ССІ, управляющая формой, куда пользова- 
тель может ввести произвольное выражение Реп и получить результат его выпол- 
нения! Как и любые внешние данные, эта строка будет меченой, поэтому Ре 
пока не позволит ее выполнить: сначала нужно снять признак мечености с помо- 
щью поиска по шаблону. Проблема в том, что невозможно разработать шаблон, 
способный выявить любую возможную угрозу. А вам не следует простс снимать 
признак мечености с любых получаемых данных и отправлять их во встроенную 
функцию е\а1. (Если вы сделаете это, мы почувствуем соблазн взломать вашу сис- 
тему и удалить этот сценарий.) 


Здесь приходит на помощь ге\а1. Следующий сценарий СС обрабатывает форму 
с единственным полем, вычисляет (в скалярном контексте) выражение в строке 
и выводит результат: 


#1! /иѕг/біп/рег1 -1Тм 

иѕе 5ігістї; 

иѕе СбІ: :Сагр "Рата15ТоВгомѕег" 
иѕе СбІ ом/:$фапдага еѕсарентмі /; 
иѕе Ѕағе; 


ргіпї һеадег(-туре => "ехї/һітм1; сһагѕе=0ТЕ-8"), 
зтагї_һіт1("Рег1 Ехргеѕѕіоп Веѕи1+5"), 


Не надо смеяться. Мы действительно встречали веб-страницы, которые это делают. 
Без Заге! 
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ту Фехрг = рагат(”ЕХРВ") =- /^([7; ]+)/ 
? $1 # возвращает часть, теперь уже не меченную 
: сгоак(“по уа1іа ЕХРВ №1е19 іп Ғогт"); 

ту фапѕмег = Ѕағе->пем->гема1( $ехрг) 

Оіе 1ғ $0; 


ргіос р(“Веѕи1ї оР”, Е(еѕсарентмі ($ехрг)), 
15', 11(еѕсареНтмі ($апзмег))); 


Теперь представьте себе зловредного пользователя, который введет строку "ргіпї 
`саї /еїс/раѕѕм@`" (или что-нибудь похуже). Благодаря окружению с наличием ог- 
раничений, которое запрещает использовать символ обратной косой черты, Рег] 
распознает проблему во время компиляции и немедленно вернет управление. 
В переменной $0 будет строка “дио{ед ехеси+іоп (``, ах) їгарред Бу орегаїіоп таѕк" 
(выполнение в кавычках, перехваченное маской операций) с дополнительной ин- 
формацией о том, где возникла эта проблема. 


Поскольку мы не указывали иного, наши защищенные разделы до сих использова- 
ли установленный по умолчанию набор разрешенных операций. Сейчас не важно, 
каким образом задаются разрешенные или запрещенные операции. Важно, что это 
полностью находится под контролем вашей программы. А поскольку в програм- 
ме можно создать несколько объектов Ѕаѓе, то допустимо назначать разные степе- 
ни доверия разным фрагментам кода в зависимости от источника их получения. 


Для желающих поэкспериментировать с Ѕаѓе ниже приводится маленький инте- 
рактивный калькулятор на Рен. Он позволяет вводить числовые выражения и не- 
медленно получать их значения. Но он не ограничен только числами. Он больше 
похож на пример цикла в описании е\а] из главы 27 — там можно взять все что 
угодно, вычислить и получить результат. Разница в том, что версия с Ѕаѓе не вы- 
полняет все что угодно. Вы можете запустить этот калькулятор интерактивно 
в своем терминале, вводить фрагменты кода Ре! и просматривать результаты, 
чтобы понять, какого рода защиту предоставляет Ѕаѓе. 


#! /изг/блп/рег1 -м 
н заРеса1с - демо-программа для проверки Ѕағе 
иѕе їгісї; 
изе Ѕағе; 
ту Фѕапдбох = Ѕағе->пем(); 
мһі1е (1) { 
ргіпі "Іприї: " 
ту Фехрг = <5Т01№; 
ехії ип1еѕѕ деҒіпед $ехрг; 
сһотр($ехрг); 
ргіпі “$ехрг ргодисез “; 
1оса1 $$16{_ МАВМ__} = ѕирю { е @ }; 
пу $геѕиїї = $ѕапдбох->геуа1($ехрг, 1); 
і? ($0 =- ѕ/аї \(еуа1 \9+\).*//) { 
ргіпї? "[%5]: %5°, $0 =- 
/гарреа Бу орегатіоп таѕк/ 
? “Ѕесигіту Уло1а оп” : "Ехсерїіоп", $6: 
} 
е1ѕе { 
ргіпЕ "[№гта1 Вези1{] $гези14\п”; 
} 
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Если передать сценарию обычное алгебраическое выражение, он вычислит вы- 
ражение и вернет результат. Если попытаться сделать что-то другое, например 
выполнить команду в обратных апострофах или загрузить модуль, вы получите 
отказ: 


Тори: 2+2 

2+2 ргодисез [М№огта1 Веѕи1+] 4 

ІприЁ: ‘1$ -1` 

`1$ -1` ргодисез |Зесигату М101ат1ог]: диотес ехесит1оп ( , 9х) ' 

їгарред бу орегаф1оп таѕк 

Іприё. изе (МР: :Ѕітр1е; деїргіпі( ‘һр: //ммм. рег1.огд9’) 

иѕе ІМР: :51тр1е; де\ргіпі( ` тр: /Имимм. рег1.ог9`) ргодосеѕ [Ѕесигіїу Міо1аїіоп]: 
`гедиіге` їгарред Бу орегаїіоп таѕк 

Іприі. 1/137 

1/13г ргодисез ЕМ№огтаг Веѕи1ї ] 0.0072992700729927 


Код, маскирующийся под данные 


Разделами Ѕаѓе можно пользоваться при обработке действительно опасных дан- 
ных, но это не значит, что защитой можно пренебречь в повседневной работе по 
дому. Необходимо совершенствовать свое знание окружающей местности и смот- 
реть на вещи с точки зрения субъекта, желающего проникнуть внутрь. Необхо- 
димо предпринимать упреждающие меры, например, поддерживать хорошее ос- 
вещение и подстригать кусты, в которых могут притаиться проблемы. 


Ре! старается помочь и в этом тоже. Принятая в Рег] схема синтаксического ана- 
лиза и выполнения позволяет избежать ошибок, жертвами которых часто стано- 
вятся языки сценариев интерпретаторов команд. Язык обладает многими очень 
мощными возможностями, но они умышленно синтаксически и семантически 
ограничены таким образом, чтобы все находилось под контролем программиста. 
За редкими исключениями, Ре интерпретирует каждую лексему только один 
раз. Если нечто используется как простая переменная с данными, оно не начнет 
вдруг шарить в вашей файловой системе. 


К сожалению, такое может случиться при обращении к интерпретатору команд 
для запуска других программ, потому что тогда вы будете работать по правилам 
интерпретатора команд, а не Рец. Впрочем, без интерпретатора легко обойтись — 
нужно лишь использовать формы функций зуз{ет, ехес или ореп, открывающей 
канал, со списком аргументов. Для обратных апострофов нет формы вызова со 
списком аргументов, защищающей от интерпретатора команд, но их всегда мож- 
но эмулировать, как описано выше в разделе «Доступ к командам и файлам с ог- 
раниченными привилегиями». (Синтаксически нельзя заставить обратные апост- 
рофы принимать список аргументов, но сейчас разрабатывается форма лежащего 
в их основе оператора геайріре со многими аргументами; на момент написания 
книги она еще не вполне была готова.) 


Когда переменная используется в выражении (в том числе интерполируется 
в строку в двойных кавычках), Совершенно Исключено, что код Ре], содержа- 
щийся в такой переменной, сделает нечто, вами не предусмотренное. В отличие 


1 Хотя, если вы генерируете веб-страницу, можно получить на выходе теги НТМГ, в том 
числе код УауаЗст1рь, которые сделают нечто, чего удаленный браузер не ожидает. 
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от интерпретатора команд, Ре! не требует охранительных кавычек вокруг пере- 
менных, что бы в них ни содержалось. 


$пем = $о19; # Кавычки не требуются 

ргіпс "Фпем 11етз\л”; # $пем не навредит вам 
фрһгаѕе = “"$пем 1фетз\п”; # И здесь тоже. 

ргіпі $рћгаѕе, # По-прежнему полный порядок 


В Рей реализован подход «ућаїѓ уои зее 13 мћаї уоп #еф» (что видишь, то и получа- 
ешь). Если вы не видите дополнительного уровня интерполяции, значит, его нет. 
Можно интерполировать в строки произвольные выражения Регї, но только если 
специально попросить об этом Рег]. (И даже в этом случае содержимое подверга- 
ется проверке меченых данных, если включен этот режим.) 


фрһгаѕе = "Усуи 1051 @{[ 1 + іп гапа(6) ]} 11 роіпіѕ\п”; 


Однако интерполяция не является рекурсивной. Нельзя сирятать в строке произ- 
вольное выражение: 


Фсоипт = "1 + 111 гапд(6)”; # Некоторый случайный код 
$ѕауіпо = "Фсоипт №1 роіпїѕ”; # Просто литерал 
$ѕауіпд = "@{[$соипї 1} һіТ роіпїѕ”; # Тоже литерап 


Оба присваивания $ѕауіпо создают "1 + 1пї гапа(6) п1г ро1пї5”, не интерпретируя 
интерполированное содержимое $соџпї как код. Чтобы заставить Ре! это сделать, 
нужно явно вызвать еуа1 ТІМ: 


фсоде = “1 + іп гапа(6)“; 
фӣіе го11 = өема1 $соде; 
діе 1# $, 


Будь $соде меченой, вызов ема1 5ТАТМб создал бы исключительную ситуацию. Ко- 
нечно, почти никогда не требуется вычислять случайный код, но если вдруг при- 
дется, то следует подумать об использовании модуля Ѕаѓе. Возможно, вы уже слы- 
шали о таком. 


Есть одно место, в котором Ре! может иногда обрабатывать данные как код, 
а именно, когда шаблон в операторах 0г//, п// или < / содержит одно из новых ут- 
верждений регулярных выражений, (?{С00Е}) или (??{С00Е}). Они не угрожают 
безопасности, если используются как литералы при поиске по шаблону: 


ФспЕ = $п = 0, 
мһі1е ($дафа =- /( \9+ (7{ Фп++ }) | \м+ )/дх) { 
$спї++; 


} 


ргіпі “бої Фспї могаѕ, $п оѓ мћісћ меге 91911$.\п”; 


Но существующий код, который интерполирует переменные в шаблон, был напи- 
сан в предположении, что данные – это данные, а не код. Эти новые конструкции 
могут создать брешь в прежде безопасных программах. Поэтому Рег! отказывает- 
ся интерпретировать шаблон, если интерполируемая строка содержит утвержде- 
ние с фрагментом кода, и возбуждает исключительную ситуацию. Если такая воз- 
можность действительно необходима, ее всегда можно включить директивой изе 
ге ‘еуа1” с лексической областью видимости. (Однако по-прежнему нельзя исполь- 
зовать меченые данные для интерполируемого утверждения с фрагментом кода.) 


Работа с ненадежным кодом - 645 


Совершенно иного рода проблемы безопасности, связанные с регулярными выра- 
жениями, относятся к отказу в обслуживании. Из-за них программа может за- 
кончить работу слишком рано, работать слишком долго, исчерпать всю имею- 
щуюся память, а иногда и потерпеть крах - в зависимости от фазы луны. 


При обработке шаблонов, полученных от пользователей, не нужно беспокоиться 
о возможности интерпретации случайного кода Рен. Однако в механизме регуляр- 
ных выражений есть свои маленькие компилятор и интерпретатор, а пользова- 
тельский шаблон может вызвать у компилятора регулярных выражений изжогу. 
Если интерполированный шаблон является недопустимым, возникает исключи- 
тельная ситуация, которая станет фатальной, если не будет обработана. Обрабаты- 
вая эту ситуацию, используйте только е\а1 ВЕОСК, а не еуа1 5ТАТМб, потому что до- 
полнительный уровень интерпретации в последнем может на практике допускать 
выполнение случайного кода Регі. Вместо этого сделайте нечто вроде следующего: 


11 (пої ема1 { “” =- /$татсһ/; * }) { 
# (Обработать подозрительный шаблон. } 

} 

е1зе { 
# Мы знаем, чтс шаблон по крайней мере компилируется. 
іҒ ($дафа =- /фтафси/) { .. } 

} 


Более неприятная проблема отказа в обслуживании возникает, когда при пра- 
вильных данных и правильном шаблоне поиска программа зависает навсегда. 
Это связано с тем, что для некоторых шаблонов сопоставления время обработки 
растет экспоненциально и может превысить среднее время наработки на отказ на- 
шей солнечной системы. Если вам особенно повезет, то для такого шаблона с ин- 
тенсивными вычислениями потребуется еще и экспоненциально растущий объем 
памяти. В таком случае ваша программа исчерпает всю имеющуюся виртуаль- 
ную память, утопит остальную часть системы, выведет из себя пользователей 
и либо закончит существование с обычной ошибкой «Оиё оѓ шетогу!», либо оста- 
вит после себя громадный файл с дампом памяти, хотя, возможно, он будет не 
таким большим, как солнечная система. 


Как большинство атак типа «отказ в обслуживании», эту проблему нелегко пре- 
дотвратить. Если платформа поддерживает функцию а1агт, можно ограничить 
время поиска по шаблону. К сожалению, Рег! (в настоящее время) не может гаран- 
тировать, что обычная обработка сигнала не вызовет сбой программы. (Планиру- 
ется исправить это в следующих версиях.) Однако вы всегда можете попробовать 
этим воспользоваться, и даже если сигнал не удастся красиво обработать, по 
крайней мере, программа не будет работать вечно. 


Если ваша система поддерживает ограничение ресурсов, выделяемых каждому 
процессу, можете установить свои ограничения из интерпретатора команд, преж- 
де чем запускать программу Регі, либо использовать модуль 850: :Везоигсе из СРАМ, 
чтобы сделать это прямо из Ре]. Веб-сервер Арасћһе позволяет устанавливать гра- 
ницы времени, памяти и размера файла для запускаемых им сценариев СОТ. 


Наконец, мы надеемся, что вы дочитываете эту главу, испытывая гнетущее чув- 
ство опасности. Помните, что если вы параноик, то это не значит, чтс за вами ни- 
кто не гонится. И раз уж на то пошло, вы можете получить от этого удовольствие. 
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Распространенные приемы 
программирования 


Любой программист на Реп с удовольствием даст вам массу советов, как програм- 
мировать. Мы не исключение (если вдруг вы еще не поняли). В данной главе мы не 
станем рассказывать о специфических возможностях Регі, а зайдем с другого кон- 
ца и используем более вольный подход для описания идиом Регі. Надеемся, что 
связав, казалось бы, несвязанные вещи, вы сможете в большей мере проникнуть- 
ся ощущением того, что означает «думать на Регі». В конце концов, когда вы про- 
граммируете, вы не создаете сначала несколько выражений, затем несколько под- 
программ и в конце несколько объектов. В какой-то мере приходится заниматься 
всем этим одновременно. Так и в этой главе – немного обо всем сразу. 


Однако элементарная организация здесь все-таки есть, и проявится она в том, 
что, начав с отрицательных примеров, мы будем продвигаться в направлении нпо- 
ложительных. Не знаем, станет ли от этого легче вам, но нам - станет. Кроме то- 
го, на протяжении всей своей карьеры программиста вы будете учиться тому, что 
не следует делать, прежде чем научитесь делать то, что следует, так что начинай- 
те привыкать заранее. 


Обычные промахи новичков 


Самая большая ошибка – забыть включить вывод предупреждений директивой 
иѕе магп1пдз, идентифицирующей многие ошибки. Вторая по масштабам ошибка — 
забыть вставить иѕе ѕігісї, где она уместна. Эти две прагмы могут уберечь от дол- 
гих часов бесплодных раздумий, когда ваша программа начнет разрастаться в объ- 
еме. (А она начнет.) Еще одной оплошностью будет забыть проконсультироваться 
с ре{ад. Допустим, вы хотите узнать, есть ли в Рег| функция гоџпа. Сначала можно 
попытаться поискать в распространенных вопросах — при помощи регій0с: 


% рег1дос -а гоупа 


Помимо этих «метапромахов» существует ряд ловушек программирования. В не- 
которые из них попадает почти каждый, а в другие можно угодить, только придя 
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из другой культуры, где многое делается иначе. Ошибки эти сгруппированы 
в следующих разделах. 


Всеобщие ошибки 


• Запятая после дескриптора файла в команде ргіпі. Хотя кажется совершенно 
нормальным и приличным сказать: 


ртіпї 5Т0О0Т, “доодруе", фадј, “мог19!\п”; # НЕВЕРНО 


это, тем не менее, некорректно из-за этой первой запятой. Вместо этого здесь 
нужен синтаксис косвенного объекта: 


ргіпі 5ТОО0Т "одоодруе”, $а9], “могад!\п”, # ок 
Этот синтаксис позволяет сказать: 
ргіпі $ғі1еһапа1е "ооодбуе”, $адј, "мога! \п"; 


где фѓі1епапд1е — скаляр, содержащий дескриптор файла на этапе выполнения. 
Это не то же самое, что: 


ргіп $поағі1еһапд\е, "доодбуе”, $ад), “мог19!\п”; 


где $поѓаѓі1еһапд1е интериретируется как часть списка выводимых данных. 
В данном случае вы увидите в терминале нечто подобное: С ОВ(ОхОЕАРВЕЕЕ), по- 
тому что будет выполнен вывод в стандартный поток вывода ссылки на де: 
скриптор файла в строковой форме. 


См. «косвенный объект» в глоссарии. 


• Применение == вместо ед и != вместо пе. Операторы == и != используются для 
сравнения чисел. Другие два оператора выполняют проверки строк. Строки 
"123" и “123.00” равны как числа, но не равны как строки. Кроме того, любая 
нечисловая строка численно равна нулю, и некоторые из них, такие как 
"123ху2", вы, вероятно, не собирались использовать в числовом контексте За 
исключением ситуаций, когда вы работаете с числами, почти всегда следует 
использовать операторы сравнения строк. Прагма магп119$ сообщит о попыт- 
ках использовать эти операторы в нечисловом контексте. 


» Отсутствие замыкающей точки с запятой. Каждая команда в Рег! завершает- 
ся точкой с запятой или концом блока. Символы перевода строки не служат 
окончанием команды, как в ашк, Руоп или РОЕТКА М№. Помните, что Ре] 
похож на С. 


Инструкция, содержащая внедренный документ, особенно чувствительна к по- 
тере точки с запятой. Она должна выглядеть так: 


ргіпЕ <<’ЕТМ 5" 

А ?оо1іѕћ сопѕіѕіепсу 1$ їһе һобдоб11іп о? 11 1е піпаѕ, 

адогед Бу 1іїї1е ѕїаїеѕтеп апа рһі1оѕорћегѕ апа діуіпеѕ. 
--Ва1рһ Ма10о Етегѕоп 

РІМ№ІЅ 


• Отсутствие фигурных скобок при 810СКк. Простые инструкции не являются 
блоками. При создании управляющей структуры, такой как мһ:1е или іў, со- 
стоящей из одного или более блоков, необходимо заключать каждый блок 
в фигурные скобки. Помните, что Рег] – это не С. 
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• Забывают сохранять переменные $1, $2 и т.д., при переходе к новому регу- 
лярному выражению. Помните, что каждая успешная операция п/аїсһ; или 
З/ц6з1/ти1оп/ изменяет (или чистит, или портит) переменные $1, $2, ... Один из 
способов сразу сохранить их — выполнить поиск в списочном контексте: 


ту ($опе, $мо) = /(\м+) (\м+)/; 


• Многие не понимают, что 10са1 изменяет значение переменной, которое видят 
другие подпрограммы, вызываемые в пределах области видимости локальной 
переменной. Легко забыть, что 10са1 является инструкцией этапа выполне- 
ния, которая создает динамическую область видимости, поскольку для нее 
нет эквивалента в языках типа С. См. раздел «Объявления с областью видимо- 
сти» в главе 4. В любом случае обычно требуется пу вместо 10са1. 


• Потеря парности фигурных скобок. Хорошие текстовые редакторы помогают 
находить пары. Обзаведитесь таким. (Или такими.) Немалую помощь окажет 
следование определенному стилю расположения скобок, благодаря чему вы 
будете знать – где ожидать их, даже если другие готовы драться, доказывая, 
что это неправильно. Такие инструменты, как Рег1: Ті0у, помогут вам отфор- 
матировать ваш код. 


• Применение инструкций управления циклами в 00 {} «ћі1е. Хотя фигурные 
скобки в этой конструкции выглядят подозрительно похожими на части блока 
цикла, они таковыми не являются. 


• Использование $Г00[1], когда имеется в виду $Г00[0]. Нумерация элементов 
в массивах Ре! по умолчанию всегда начинается с нуля. В прежние времена 
Регі пытался быть гибким, позволяя начинать нумерацию с любого числа 
с помощью специальной переменной $[, но начиная с версии у5.12 этот прием 
считается устаревшим. 


» Использование @ѓоо[0], когда имеется в виду $#о0[0]. Ссылка 6Го0[0] является 
срезом массива, т.е. массивом, состоящим из единственного элемента $ѓоо[0]. 
Иногда никакой разницы нет, как в: 


ргіпі "ЕНе апзмег 13 @Роо[0]\п”; 


но она очень велика в следующем случае: 
@гоо[0] = <5101М>, 


когда будет «проглочено» все, оставшееся в ЭТОТ, переменной $100[0] будет 
присвоена первая строка, & все остальное будет отброшено. Едва ли это входи- 
лов ваши намерения. Приучите себя думать. что $ соответствует единственно- 
му значению, а @ — списку значений, и все у вас будет в порядке. 


• Потеря круглых скобок в списочном операторе, таком как пу, что делает одну 
переменную лексической, а другую – глобальной: 


ту $х, Фу = (4, 8); # НЕВЕРНО 
пу ($х, $у) = (4, 8); # ок 


• Забывают выбрать правильный дескриптор файла, прежде чем установить $”, 
$- или $]. Эти переменные зависят от дескриптора файла, выбранного в дан- 
ный момент посредством ѕе1есі(ЕЛ ЕНАМ0ІЕ). Первоначальным выбранным де- 
скриптором файла является 5Т0007. Вместо этого следует использовать методы 
работы с дескрипторами файлов из модуля 10::Напо1е. См. главу 25. 
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• Забывают определить кодировку для каждого текстового потока ввода/вывода. 
Не существует такого универсального понятия, как «текстовый файл». Ключ 
-С командной строки, переменная среды РЕВЕ_ИМТСОВЕ и прагма ореп позволяют 
устанавливать кодировку, которая будет использоваться неявно, а функции 
ріплоде и ореп позволяют указывать кодировку явно. Если вы забудете устано- 
вить кодировку явно или неявно, вы не получите текстовые данные. Кодиров- 
ку нельзя угадать, она должна быть указана. 


Часто игнорируемые советы 


Практикующие программисты на Ре! должны учесть следующее: 


® Многие операции по-разному ведут себя в списочном и скалярном контекстах. 
Например: 


($х) = (4, 5, 6); # Списочный контекст; $х устанавливается в 4 

$х = (4,5, 6); # Скалярный контекст: $х устанавливается в 6 

ба = (4, 5, 6); 

$х = а: # Скалярный контекст: $х устанавливается в 3 (длинг массива) 


• Желательно избегать голых (Баге) слов, особенно если они написаны целиком 
в нижнем регистре. Нельзя, лишь посмотрев на слово, сказать, функция это 
или просто строка. Используя кавычки для строк и круглые скобки для аргу- 
ментов функций, вы никогда их не спутаете. На практике директива иѕе ѕїгіс+ 
в начале программы делает голые слова ошибкой этапа компиляции, что, ве- 
роятно, правильно. 


• Невозможно по внешнему виду определить, какие встроенные функции явля- 
ются унарными операторами (как спор и сп01г), какие — списочными (как ргіпї 
и ип1іпк), а какие не имеют аргументов (как їіпе). Это вы сможете узнать из 
главы 27. Как всегда, если вы не уверены, используйте круглые скобки — даже 
если вы не уверены в том, что вы не уверены. Заметьте также, что определен- 
ные пользователем подпрограммы по умолчанию являются списочными опе- 
раторами, но они могут быть объявлены как унарные операторы с помощью 
прототипа ($) или как не имеющие аргументов с помощью прототипа (). 


• Трудно запомнить, что некоторые функции по умолчанию принимают в каче- 
стве аргументов $_, @АВСУ или что-либо еще, а другие — нет. Потратьте время, 
чтобы запомнить, «кто есть кто», либо избегайте использования аргументов 
по умолчанию. 


® <РН> не является дескриптором файла; это оператор угловых скобок, осущест- 
вляющий операцию чтения строк из дескриптора. Эта путаница обычно про- 
является, когда пытаются выполнять ргіпі в этот оператор: 


ргіп? <ЕН> "һі” # НЕВЕРНО. опустите угловые скобки 


• Помните, что данные, которые читает оператор угловых скобок, присваивают- 
ся переменной $_, только когда чтение файла является единственным услови- 
ем в цикле мћі1е: 


мһі1е (<ЕН>) { } # Данные присваиваются $_. 
<ЕН>; # Данные читаются и отбрасываются! 


• Не применяйте =, когда требуется =-; это разные конструкции: 
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$х = /Ғоо/; # Ищет "Ғоо” в $_. помещает результат в $х 
$х =- /Ғоо/; # Ищет “Ғоо” в $х. отбрасывает результат 


• Используйте /г в операциях подстановки для возврата результата. 
ёпем = пар { $/о19/пем/г } @014: 


» Используйте пу для локальных переменных, если можно обойтись этим. Клю- 
чевое слово 10са1 просто назначает глобальной переменной временное значе- 
ние, что оставляет вероятность возникновения непредвиденных побочных эф- 
фектов динамических областей видимости. 


• Избегайте применения 10са1 с экспортированными переменными модуля. Ес- 
ли вы локализуете экспортированную переменную, ее экспортированное зна- 
чение не изменится. Локальное имя станет псевдонимом нового значения, но 
внешнее имя остается псевдонимом оригинала. 


Ловушки С 


Мозговитые программисты на С должны учесть следующее: 
• В блоках и ий Пе фигурные скобки обязательны. 
• Вы должны использовать е1511, а не «ее 1» или «еї». Следующий синтаксис: 


ЇР (ехргеѕѕіоп) { 
Боск; 

} 

е]зе іЁ (апо{Нег_ехргеззтоп) { # НЕВЕРНО 
апоїћег_р1оск: 

} 


является недопустимым. Часть е1зе всегда является блоком, а голый ії не яв- 
ляется блоком, Не ждите от Рег! точногс сходства с С. Вот что вам нужно: 


1Е (ехргеѕѕіоп) { 
Боск; 

} 

е151{ (апоїћег_ехргеѕѕіоп) { 
апотпег_61оск; 

} 


Обратите также внимание, что «еП1{» – это перевернутый «е». Только разра- 
ботчикам на Ао] могло понадобиться ключевое слово, которое совпадает 
с другим словом, записанным наоборот. 


• Ключевые слова бгеаки сопііпие из С превратились в Регі в 1а5ї и пех* соответ- 
ственно. В отличие от С, они не работают в конструкции йо {} мћі1е. 


• В Рей долгое время отсутствовал эквивалент инструкции ѕ№1їсһ из С. В Рей 
версии у5.10 появилась «инструкция з\сВ на стероидах» с причудливым 
именем дімеп-мһеп (потому что это действительно весьма причудливая конст- 
рукция). См. главу 4. Кроме того, аналог инструкции зи {с! легко построить из 
имеющихся конструкций; см. «Голые блоки» и «Инструкция ріуер» в главе 4.) 


• Имена переменных в Ре! начинаются с $, @ или %. 


• Комментарии начинаются с #, а не /*. Для оформления многострочных ком- 
ментариев используйте синтаксис определения встроенного документа. 
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Нельзя получить адрес чего-либо, хотя в Регі имеется аналогичный оператор 
(обратная косая черта), создающий ссылку. При преобразовании ссылки в стро- 
ку можно получить некое подобие адреса, но вы все равно не сможете восполь- 
зоваться им. 


Имя АВС\У должно записываться в верхнем регистре. $АНС\/[0] — это агоу[1] в С, 
а агду[0] из С хранится в $0. См. главу 25. 


Системные вызовы, такие как 1іпк, ип1іпк и гепапе, возвращают в случае успе- 
ха истину, а не 0. 


Обработчики сигналов в #516 работают с именами, а не номерами сигналов. 


Ловуш ки интерпретатора команд 


Сообразительные разработчики сценариев для интерпретатора команд (ѕһећ) 
должны принять во внимание следующее: 


Переменные в левой части присваивания имеют префиксы $, @ или %, как 
и в правой. Присваивание в стиле интерпретатора команд: 


сате1=“дготедагу”, # НЕВЕРНО 
будет воспринято не так, как вам бы хотелось. Правильно так: 


%сапе1="аготедагу"; # ок 
Переменная цикла в ѓогеасћ тоже требует $. Тогда как в сзћ допустимо: 


Ғогеасћ һитр (опе м0) 
ТИРЕ іТ Ф$һитр 
епа 


в Ре! это записывается так: 


Ғогеасһ $һитр (“опе“, ‘№мо”) { 
ЭТиЕЕ_ 1 (Фпитр); 
} 


Оператор обратного апострофа выполняет интерполяцию переменных, не об- 
ращая внимания на присутствие одинарных кавычек в команде. 


Оператор обратного апострофа не производит трансляцию возвращаемого зна- 
чения. В Рен необходимо отбросить символ перевода строки явно, например 
так: 


спотр(ФЕћіѕһоѕЕ = `Позфпапе`); 


Интерпретаторы команд (особенно сѕћ) выполняют несколько проходов под- 
становки в каждой командной строке. Рег] осуществляет интерполяцию толь- 
ко в определенных конструкциях, таких как двойные кавычки, обратные 
апострофы, угловые скобки и шаблоны для поиска. 


Интерпретаторы команд обычно выполняют сценарии по частям. Рей цели- 
ком компилирует программу перед ее выполнением (за исключением блоков 
ВЕСТА, которые выполняются до того, как завершится компиляция). 

Доступ к аргументам программы осуществляется через @АВС\, а не $1, $2 ит.д. 


Достун к среде в виде отдельных скалярных переменных не предоставляется 
автоматически. Если вам это требуется, используйте стандартный модуль Еп\. 
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Ловушки Ру{Поп 


Оба языка, Ре и Ру оп, являются динамическими, имеют общие корни и по- 
явились с разницей в пять лет (1987 и 1991). Более того, Регі 4 даже заимствовал 
объектную систему из Ру&Поп для Регі 5. Эти два языка имеют массу сходств, ес- 
ли не обращать внимания на синтаксис, но многое в них реализовано совершенно 
по-разному. 


Ру&оп и Ре! иногда используют разные слова для описания одних и тех же 
понятий, а иногда одинаковые – для разных понятий; см. табл. 21.1. 


Таблица 21.1. Соответствие некоторых понятий в Руіћоп и Рей 


Рутоп 
Кортеж 


Список Массив 


Словарь 


Переменные в Рей начинаются с $, @ или %. Использование разыменовываю 
щих символов, например $$1г, позволяет языку Рей отделять существитель- 
ные от глаголов, поэтому вы никогда по ошибке не переопределите встроен- 
ные имена, что допускает Руіћоп, если попытаетесь использовать имя ѕїг для 
своих нужд. Рей позволяет переопределять встроенные имена, но никогда — 
случайно, как в Ру&Воп. 


Не забывайте использовать и5е иагп1пд$, чтобы позволить Ре! выводить пре- 
дупреждения в ситуациях, которые в Руіћоп порождают исключения. В про- 
тивном случае в Регі вы узнаете о многих интересных вещах, только если спе- 
циально начнете проверять их; т.е. забыв об этой прагме, вы никогда о них не 
узнаете. См. также описание магпіпдѕ и аитод1е в главе 27. 


Многие встроенные функции принимают аргументы по умолчанию или опре- 
деляют действия по умолчанию для наиболее типичных случаев. См. главу 21. 


Методы в языке Ру{Моп принимают явные списки параметров. В Рей принято 
распаковывать аргументы внутри функции, что обеспечивает большую гиб- 
кость в количестве аргументов и порядке их следования. Мы считаем это осо- 
бенностью, но если вам покажется, что приходится слишком много шаблонно- 
го кода для распаковки аргументов функций, посмотрите в сторону модуля 
Метпоа::$ідпаїџгеѕ из СРАМ. 


Шаблоны регулярных выражений Ре! распознает и компилирует на этапе 
компиляции программы. 


Конструкция \МЛАМЕ} в Ре! позволяет определять сокращения, псевдонимы 
и собственные имена (которые могут быть разными в разных лексических об- 
ластях видимости), а конструкция \№/МАМЕ} в Рућор - нет. 


Символы в Рег] – это абстрактные коды Юникода, а не низкоуровневые коды, 
как в Руіћопр. 


Механизм сопоставления с шаблоном в Рег! руководствуется правилами Юни- 
кода при сопоставлении без учета регистра символов, а в Руіћоп используются 
правила АЗСП, т.е. например, все три сигмы греческого алфавита при сопос- 
тавлении без учета регистра в Рег! будут признаны совпадающими. 
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• Функции отображения регистра символов в Рей, такие как ис и 1с, следуют 
правилам Юникода, поэтому они воздействуют на все символы с изменяемым 
регистром, а не только на буквы. 


• Рег] распознает (потенциально вложенные) лексические области видимости 
и поэтому обеспечивает возможность создания полноценных лексических за- 
мыканий. В Ру оп этого нет, так что полные лексические замыкания не под- 
держиваются. 


• ВРегі обеспечивается полная поддержка приведения регистра символов Юни- 
кода, поэтому изменение регистра символов в строке может приводить к ее уд- 
линению. В Ру&Воп используются лишь простейшие правила приведения ре- 
гистра символов Юникода (когда они вообще используются), что не позволяет 
получать столь же хорошие результаты при работе со строками. 


• Любые подпрограммы, возвращающие связанные (освященные) ссылки, в Рег] 
считаются конструкторами. Для конструкторов не предусмотрены какие-то 
особые правила именования. 


• Методы в Ре! – это обычные методы, и они всегда в качестве бонуса получают 
своего инвоканта в первом аргументе. Язык Регі сам по себе не предусматрива- 
ет различий между методами объектов, методами классов или статическими 
методами, как в Руіћоп. 


• Объектная ориентированность в Рег! является необязательной дополнитель- 
ной возможностью. Рег не распространяет объектную ориентированность на 
встроенные типы, если не попросить его об этом явно, – не все в этом языке 
имеет методы. Однако вам может понравиться прагма аџтобох. 


• ВрРегі вы вызываете функцию с аргументами: 
ту $$г1пд = 701п(“ |“, ди(Рутпоп Рег1 Виру) ); 


В Руіћоп, вероятно, придется интерпретировать первый аргумент как объект 
и вызывать его метод: 


пем = |”. }оли(["Рупоп", “Рег1”, “Виру” ]) 


• В Рей поиск по шаблону не привязывается к какой-то конкретной позиции 
в тексте, если явно не определить якорные метасимволы в шаблоне. В Руіћоп 
метод ге.ѕеагсһ() действует аналогично, но метод ге.паїсћ() выполняет поиск 
только с начала строки. 


• Строки в Реп не нвляются массивами символов, поэтому к ним неприменимы 
операции над массивами. Со строками, естественно, используются только 
строковые операции. 


• За исключением самой обратной косой черты или разделителя с обратной ко- 
сой чертой, Реп никогда не интерпретирует экранированные последователь- 
ности с обратной косой чертой в строках, заключенных в одиночные кавычки, 
как это делает Ру Топ. Строки в одиночных кавычках в Регі, такие как '\!', 
больше напоминают «сырые» строки в Руіћоп, такие как г'\{'. 


‚ Обратные апострофы в Ре’ используются для заключения и выполнения ли- 
тералов произвольных системных команд и возвращают их вывод, например: 
фғі1е = `саї Роо.с`. 

• В Рег] нет необходимости предварительно выделять память, как в Руіћоп. по- 
тому что массивы и другие структуры данных изменяются в размерах по мере 
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необходимости, иногда в результате самооживления или автовивификации 
(аиіогіріјрісаіоп). В Руіћоп требуется явно увеличивать размеры списков и яв- 
но размещать новые списки и словари. 


В случае ошибок при выполнении обычных операций, таких как открытие 
файла, Ру&Поп часто возбуждает исключения, тогда как Рег] возвращает спе- 
циальные значения, обычно ипдеї. Это означает, что, не проверив возвращае- 
мое значение, вы пропустите ошибку. Чтобы заставить системные вызовы ге- 
нерировать исключения, используйте прагму аитод1е. 


В случае ошибки преобразования строки в число или при попытке интерпре- 
тировать ипдеѓ как определенное значение, Регі не возбуждает исключение по 
умолчанию. Такое поведение можно изменить объявлением: 


иѕе магпіпдѕ ҒАТАі => а(питегіс ип1п1{1а1127е9); 


Списки в Регі никогда не вкладываются друг в друга, даже если указать до- 
полнительные скобки. Используйте квадратные скобки. чтобы создавать вло- 
женные массивы (массивы ссылок). 


Оператор диапазона в Рег] включает в диапазон обе границы, т.е. 0..9 включа- 
ет0и 9. 


Интерактивной оболочкой языка Ре! является его отладчик (глава 17), но су- 
ществует еще одна замечательная интерактивная оболочка, О0е\е1::ВЕРЕ. Вызов 
Рей без аргументов не запускает интерактивный цикл чтение-вычисление- 
вывод (геад-еуа1-ргіп}), как в Руіћоп. Для этого следует использовать команду 
регі -де0. 


Ловушки Кибу 


Мацумото Юкихиро (Маї2), создатель ВаБу, многое заимствовал из Рег! (и мы 
считаем, что он правильно выбрал стартовую позицию). Фактически он поселил 
вместе Рег] и ЗтаШаК и позволил им дать потомство. 


В Рег] нет аналога команды ігр (интерактивная КоБу-оболочка). См. раздел 
о Ру+ћоп. 


В Рей есть просто числа. Он не беспокоится о наличии или отсутствии в них 
дробной части. 


В Рег] нет необходимости заключать переменные в {} (#{} в Кобу) для их интер- 
поляции, если только не требуется устранить неоднозначность: 


"Му Ғауогіте 1апдиаде 1$ $1апо’ 


Интерполируемые строки в Рег| необязательно заключать в двойные кавыч- 
ки: можно использовать оператор 44 с произвольными разделителями. Анало- 
гично, неинтериолируемые строки необязательно заключать в одиночные ка- 
вычки: можно использовать оператор д с произвольными разделителями. 


д/Тһаї`ѕ а11, Ро1Кз/ 
а(Мо іпёегро1іаїіоп Рог $100) 
99(Тптегро1а1оп Гог Ф$апіта: ) 


Инструкции в Регі должны разделяться точкой с запятой (;), даже если нахо- 
дятся в разных строках. Последнюю инструкцию в блоке не требуется завер- 
шать точкой с запятой. 
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• Регистр символов в именах переменных не несет дополнительной смысловой 
нагрузки для регі. 


е Разыменовывающие символы не определяют область видимости переменной 
или ее тип. Символ $ в Ре! — это единственный элемент, например: $зса1аг, 
фаггау[0] или $һаѕһ{$Кеу}. 


• Сравнение строк в Рег выполняется операторами 11, 1е, ед, пе, де и дї 
• Никаких волшебных блоков, но взгляните на Рег1Х::МеіћодСа11ИіїћВ1оск. 
• Функции в Регі определяются на этапе компиляции. То есть фрагмент 


иѕе м5. 10. 

зир Роо { ѕау `Сате1іа' ) 
Ғоо( ); 

3и6 Ғоо { зау "Ате1ја" }; 
Ғоо(); 


дважды выведет слово Апе1іа, потому что к моменту начала выполнения про- 
граммы будет действовать второе определение функции. Это также означает, 
что вызов подпрограммы может находиться в файле выше ее определения. 


• В Рей отсутствуют переменные класса, но многие пытаются имитировать их 
с помощью лексических переменных. 


• Оператор диапазона в Ре! возвращает список, но взгляните на расширение 
Рег1Х::Вапде. 


• Модификатор /5 шаблонов обеспечивает соответствие точки (.) символу пере- 
вода строки, тогда как в Киђу ту же роль играет модификатор /п. Модифика- 
тор /п в Рей обеспечивает соответствие якорных символов ^ и $ с началом 
и концом логических строк. 


• ВРеН используются плоские списки. 


» Оператор => в Рег] может находиться практически везде, где допускается запя- 
тая, поэтому в программах на Регі часто можно видеть, как оператор стрелки 
=> используется, чтобы указать направление: 


гепате $014 => $пем; 


• В Рег! значения 0, "С", ^”, () и иде? означают «ложь» в логическом контексте. 
В базовом языке Ре! отсутствуют специальные логические значения, однако 
обратите внимание на модуль боо1еап. 


• В Рег часто вместо п11 используется ипдет. 


® Иногда Рей требует особой внимательности, потому что некоторые символы 
имеют в нем особое значение. Например, вопросительный знак ?, следующий 
за именем переменной, не является частью этого имени: 


ту $Е1ад = $100? 0 :1, 


Ловушки Јаха 
• В Рег] нет метода паіп или ему подобного: 


рир1іс ѕТатіс моі таіп(Ѕгіпо[ ] агом) {Пгомз ІОЕхсерііоп 
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• Рей выделяет память автоматически, по мере роста массивов и хешей. Авто- 
оживление означает, что память будет выделена в момент присваивания, если 
она не была выделена раньше. 


• Рен вынуждает объявлять переменные заранее, только если используется 
прагма изе ѕїгісї. 


• Рег! различает значения и ссылки на значения, т.е. вам (как правило) необхо- 
димо явно разыменовывать ссылки. 


• ВРегІ функции не обязаны быть методами. 


® Строковые и числовые литералы в Рег! обычно объектами не являются, но мо- 
гут ими быть. 


• Программисты на Јауа, определяющие структуры данных как классы, могут 
удивиться, обнаружив, что в Регі они создаются на основе простых объявле- 
ний, смешивающих анонимные хеши и массивы. См. главу 9. 


• Данные экземпляров в Ре! являются (обычно) простыми значениями в хеше, 
используемом в качестве объекта, где имя поля в хеше соответствует имени 
элемента данных экземпляра в дата. 


» Закрытые данные в Ре! не являются обязательными. 


• Функция, которая в конечном итоге будет вызвана при обращении к методу, 
неизвестна до момента выполнения, так что может быть вызван любой объект 
или класс с методом, имеющим это имя. Значение имеет только интерфейс. 


• Рей поддерживает перегрузку операторов. 


• Рей не поддерживает перегрузку функций по сигнатуре. Обратите внимание 
на модуль С1аз5: :Ми1{1тетпод в СРАМ. 


• Рег допускает множественное наследование, хотя этот механизм больше на- 
поминает реализацию множества интерфейсов в Јауа, поскольку классы в Регі 
наследуют только методы, но не данные. 


» Значение типа сһаг в Јауа — это не абстрактный код Юникода; это часть кода 
символа в кодировке ОТЕ-16. То есть полный код занимает два значения спаг 
в дауа, и требуе+ применять специальные приемы программирования при об- 
работке символов за границами основной многоязычной таблицы (Ваѕіс Ми1бі- 
Ппдиа! РЛапе) в Јауа. В Ре], напротив, символ является абстрактным кодом 
Юникода, фактическая реализация которого преднамеренно скрыта от про- 
граммиста. Программный код на Рег! автоматически работает со всем диапа- 
зоном символов Юникода, а также за его пределами. 


• В отличие от Јауа, строковые литералы в Рей могут включать символы пере- 
вода строки буквально. Однако внедренные документы все же лучше подходят 
для этой цели. 

• Обычно функции сообщают об ошибке, возвращая упадет, а не возбуждая ис- 
ключение. Если вам больше по душе другой путь, используйте прагму аџїойіе. 


• ВрРен не используются именованные параметры; аргументы внутри функций 
доступны в виде массива @_. Однако, обычно им сразу же присваиваются име- 
на. Обратите внимание на модуль Меїћой$::5ідпаїџгеѕ из СРАМ, если предпочи- 
таете более формальный способ объявления имен параметров. 


• Такие понятия, как прототипы функций Рег, вообще отсутствуют в Јауа. 
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» Рей поддерживает передачу параметров по именам, позволяя опускать необя- 
зательные аргументы и передавать аргументы в произвольном порядке. 


• Система сборки мусора Ре! основана на подсчете ссылок, поэтому есть воз- 
можность написать деструктор, автоматически освобождающий ресурсы, та- 
кие как открытые дескрипторы файлов, соединения с базами данных, блоки- 
ровки файлов и другие. 


• Регулярные выражения Ре! не требуют использования дополнительных сим- 
волов обратной косой черты. 


• Литералы регулярных выражений Ре! компилирует, проверяя их синтаксис 
на этапе компиляции, и сохраняет в скомпилированном виде для большей эф- 
фективности. 


• При сопоставлении с шаблоном Ре! не подразумевает наличие неявных якор- 
ных символов в шаблоне, как это делает метод паїсћ в Јауа. Принцип действия 
сопоставления с шаблоном в Рен больше напоминает метод {110 в дата. 


® Шаблон в Рен может иметь несколько сохраняющих групп с одинаковым име- 
нем. 


• Шаблоны в Ре! могут быть рекурсивными. 


• Чтобы задействовать механизм свертки регистра Юникода для сопоставления 
без учета регистра символов, в шаблонах Јауа требуется использовать специ- 
альный параметр, а в Рег| шаблоны используют этот механизм по умолчанию. 
Кроме того, Рей поддерживает свертку регистра в полном объеме, а в Јауа ис- 
пользуется упрощенный подход. 


В шаблонах Јауа традиционные классы символов, такие как \м и \5, по умол- 
чанию охватывают только символы АЗСП, а для распространения их дейст- 
вия на символы Юникода требуется передавать специальный параметр. Шаб- 
лоны в Ре; поддерживают Юникод по умолчанию, поэтому специальный па- 
раметр необходимо передавать для сужения области действия классов симво- 
лов до набора АЗСП. 


• Механизм УМ в Јауа соответствует механизму ХЗ в Рег, по крайней мере по 
духу. Модули в Ре] часто включают скомпилированные компоненты на С/ 
С++, а в Јауа это редкость. 


» Ненужно стремиться все переписать на Реп; Рей позволяет легко и просто вы- 
зывать системные программы с помощью обратных апострофов, ѕуѕїеп и вари- 
анта ореп для открытия каналов. 


Эффективность 


Часто работа программиста состоит лишь в том, чтобы заставить программу пра- 
вильно работать, но не исключено, что вы захотите добиться большего от своей про- 
граммы. Богатый арсенал операторов, типов данных и управляющих конструкций 
не всегда позволяет интуитивно оценить возможности оптимизации по скорости 
или памяти. Разработчикам Ре! пришлось пойти на многочисленные компромис- 
сы, и такие решения погребены в глубинах кода. В целом, чем короче и проще ваш 
код, тем он быстрее выполняется, но встречаются исключения. В данном разделе 
мы попытаемся помочь вам заставить свои программы работать капельку лучше. 
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Если программа должна работать намного быстрее, поэкспериментируйте с ком- 
пилятором Регі, описанным в главе 16, или перепишите внутренний цикл как 
расширение на С (об этом не рассказывается в данной книге). Но, прежде чем что- 
либо предпринимать, выполните профилирование программы (как описывается 
в главе 17), чтобы выявить места, где проще всего было бы выполнить необходи- 
мые оптимизации. 


Обратите внимание, что оптимизация по времени может иногда обернуться нера- 
циональным расходованием памяти или снижением эффективности программи- 
рования (на что указывают противоречивые советы ниже). Так уж это устроено. 
Будь программирование простым делом, для него не потребовалось бы такое слож- 
ное создание, как человек, не так ли? 


Эффективность по времени 


• Используйте хеши вместо линейного поиска. Например, вместо поиска по 
@Кеумогд$, чтобы узнать, является ли $ ключевым словом, создайте следую- 
щий хеш: 


пу Укеужюга5; 

Гог (@кеумогдѕ) { 
$Кеумога${$ }++ 

} 


После этого можно быстро узнать, содержит ли $_ ключевое слово, сравнив 
фКеумога{$_} с нулем. 


• Избегайте употребления индексов, когда можно использовать оператор ѓогеасћ 
или список. Применение индексов требует дополнительных операций, а так 
же, если индексы (в результате вычислений) окажутся действительными чис- 
лами, это потребует дополнительного преобразования их обратно в целые чис- 
ла. Часто можно отыскать более эффективный способ. Обдумайте возмож- 
ность применения ѓогеасћ, $5ћіѓї и $р11се. Попробуйте сказать изе іпїіедег. 


• Избегайте оператора доїо. Он производит сканирование кода от текущего ад- 
реса в поисках заданной метки. 


• Избегайте ргіпі?, если можно обойтись ргіпї. 


• Избегайте переменной $& и ее подруг $ и $. Их появление в программе приво- 
дит к тому, что при любом успешном поиске строка, в которой производится 
поиск, сохраняется для возможного использования в будущем. (Однако, если 
они появились в коде один раз, дальнейшее их использование хуже уже не 
сделает.) В Рей у5.10 появились отдельные переменные для соответствий, соз- 
даваемые модификатором /р (глава 5), которые не заставляют выбирать между 
эффективностью и удобством. 


• Избегайте применения е\а1 к строке. еуа1 строки (к е\а1 ВЁОСК это не относит- 
ся) требует перекомпиляции при каждом вызове. Анализатор Ре! работает 
довольно быстро, но это ни о чем не говорит. Почти всегда, чтобы решить зада- 
чу, есть способ получше. В частности, любой код, использующий е\а1 только 
для создания имен переменных, является устаревшим, поскольку то же самое 
можно сделать непосредственно с помощью символических ссылок: 
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по ѕігісї "геғѕ”; 
фпате = “уагіаб1е”; 
$Фпате = 7; # устанавливает Фуаг1ао1е равнои 7 


Не то чтобы мы рекомендуем такое решение, но, если вы не найдете другого 
пути, это решение привлекательнее, чем еуа1 строки. 


ж Оператор выбора альтернатив часто работает быстрее, чем соответствующее 
регулярное выражение, поэтому 


ргіпї 1 /опе-һитр/ || /мо/; 
наверняка будет выполняться быстрее, чем 
ргіпі і? /опе-һитр [мо/; 


по крайней мере, для некоторых значений опе-һитр и +мо. Последнее связано 
стем, что оптимизатор любит поднимать некоторые простые операции поиска 
в верхние части синтаксического дерева и осуществлять очень быстрый поиск 
по алгоритму Бойера-Мура (Воуег-Мооге). Сложный шаблон может помешать 
этому. 


• Используйте пехї И для упреждающего исключения «обычных» ситуаций. 
Оптимизатору это нравигся, как и простые регулярные выражения. 510 так- 
же позволяет избежать лишней работы. Обычно можно выкинуть строки ком- 
ментариев и пустые строки, прежде чем выполнить $р111 или спор: 


мһі1е (<>) { 
пехе іҒ /7#/; 
пехі і? /7$/; 
сһор; 
@р1ддіеѕ = ѕр1ії(/, /); 


} 


® Избегайте регулярных выражений с большим количеством квантификаторов 
и большими числами {МТМ МАХ} для выражений в круглых скобках. Такие 
шаблоны могут привести к экспоненциальному замедлению поиска с возвра- 
том, если «квантифицированные подшаблонь» не будут найдены при первом 
«проходе». Можно также использовать конструкцию (?>...), чтобы потребо- 
вать полного соответствия шаблона либо признания неудачи без осуществле- 
ния поиска с возвратом. 


• Старайтесь максимально увеличить длину всех обязательных литеральных 
строк в регулярных выражениях. Интуиция подсказывает обратное, но длин- 
ные шаблоны часто отыскиваются быстрее, чем короткие, потому что посто- 
янные строки оптимизатор передает алгоритму Бойера-Мура, который выиг- 
рывает от длинных строк. Скомпилируйте шаблон с ключом отладки -Пг и по- 
смотрите, какую строку литералов Ог. Ре! считает самой длинной. 


» Избегайте дорогостоящих вызовов подпрограмм в глубоких циклах. С вызо- 
вом подпрограмм связаны накладные расходы, особенно при передаче длин- 
ных списков параметров и возврате длинных значений. В порядке возраста- 
ния степени отчаяния попробуйте передавать значения по ссылке или как гло- 
бальные переменные с динамической областью видимости, встраивать (іпіпе) 
подпрограммы или переписать весь цикл на С. (Лучше, если вы сможете вооб- 
ще избавиться от подпрограмм, применив более умный алгоритм.) 
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® Избегайте повторных вызовов одной и той же подпрограммы, если известно, 
что каждый раз она будет возвращать одно и то же значение. В этом вам помо- 
гут такие модули, как Мепоіге, или сконструируйте собственный кэш для хра- 
нения известных значений (которые не будут изменяться). 


• Избегайте вызова деїс кроме как для ввода одиночных символов с терминала 
На самом деле лучше и для этого ее не использовать. Следует предпочесть 
ѕзуѕгеаа. 


• Избегайте частого применения ѕирѕїг с длинными строками, особенно если 
строка содержит текст в кодировке ЧТЕ-8. Эту функцию лучше применять 
к началу строки, а в некоторых задачах можно сделать так, чтобы зибзтг рабо- 
тала с началом, «зажевывая» строку по ходу дела с помощью $10511 с четырь- 
мя аргументами и заменяя захваченную часть на ""; 


мһіле (Фбигѓег) { 
ргосеѕѕ( ѕирѕїг(ФоиЁғег, 0, 10, ^”)), 
} 


• Используйте раск и ипраск вместо многократных вызовов ѕибѕїг. 


+ Применяйте ѕибѕіг в качестве левого значения вместо конкатенации подстрок. 
Например, для замены символов $100 с четвертого по седьмой содержимым пе- 
ременной $0аг не делайте так: 


$Ғоо = ѕибѕіг(фҒоо, 0,3) . $Баг . ѕирѕіг($ғоо, 7); 


Вместо этого просто укажите заменяемую часть строки и выполните присваи- 
вание ей: 


ѕирѕїг($Ғоо, 3, 4) = фраг: 


Но помните, что если $100 является очень длинной строкой, а $баг не соответ- 
ствует в точности размеру «дырки», это может привести к большому объему 
копирования. Ре! попытается минимизировать его, выбрав копирование с на- 
чала или с конца, но ничего особенно полезного не сможет сделать, если ѕирѕіт 
находится в середине. 


» Используйте 5/// вместо конкатенации подстрок. Особенно в случаях, когда 
можно заменить одну константу другой такого же размера. В результате полу- 
чится подстановка на месте. 


• Применяйте модификаторы команд и эквивалентные операторы апі и ог вме- 
сто полноразмерных условных операторов. Модификаторы команд (такие как 
фгіпо = 0 ип1еѕѕ $епдадед) и логические операторы позволяют избежать расхо- 
дов, связанных с входом в блок и выходом из него. Часто они еще и более удо- 
бочитаемы. 


• Используйте $Гоо = $а || $6 || $с. Это значительно быстрее (и короче), чем 


11 (Фа) { 
фғоо = Фа; 

} 

е151іҒ ($5) { 
$ғоо = $6; 

} 

е151{ ($с) { 
$Роо = $0, 
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Аналогично устанавливайте значения по умолчанию с помощью 
фра {= 3; 


® Группируйте все проверки с одинаковой начальной строкой. Проверяя строки 
на различные префиксы при помощи какой-либо конструкции, напоминающей 
структуру оператора зи сп, группируйте шаблоны /^а/, шаблоны /70/ ит.д. 


• Не проверяйте строки, про которые заранее известно, что они не содержат ин- 
тересующих вас соответствий. Используйте 1а5ї или е151ії, чтобы избежать 
«проваливания» в следующую ветку оператора зим сп. 


• Используйте специальные операторы вроде $Тиду, логические операции над 
строками, форматы раск “и” и ипраск “%". 


® Помните о хвосте, который виляет собакой. Ошибочные команды — что-то 
вроде (<5Т01№)[0] – могут нагрузить Регі лишней работой. В соответствии с фи- 
лософией ОМХ, Рен предоставляет пользователю веревку, достаточно длин- 
ную, чтобы на ней можно было повеситься. 


• Выносите операции за циклы. Оптимизатор не пытается вынести инвариант- 
ный код из циклов. Он рассчитывает на вашу сообразительность. 


» Строки могут быть быстрее массивов. 


• Массивы могут быть быстрее строк. Все зависит от того, предполагается ли 
повторно использовать строки или массивы и какие операции предполагается 
выполнять. Если требуется существенно изменять каждый элемент, лучше 
использовать массивы, а когда необходимо изменять лишь некоторые элемен- 
ты, лучше предпочесть строки. Но вы должны попробовать и убедиться в этом 
сами. 


• Переменные пу быстрее, чем переменные 10са1. 


• Сортировка по созданному вручную массиву ключей может оказаться быст- 
рее, чем использование замысловатой подпрограммы сортировки. Значение 
массива обычно сравнивается несколько раз, поэтому если подпрограмма сор- 
тировки должна выполнять массивные расчеты, лучше вынести эти вычисле- 
ния в отдельный проход перед фактической сортировкой. 


• {г/абс//0 быстрее, чем 5/|абс]//9, если выполняется удаление символов. 
• Функция ргіпї с разделителем-запятой может оказаться быстрее конкатена- 
ции строк. Например, код 


ргіпі $Ри11пате{Фпате} . һау а пем поте дігесїогу " 
Фһоте{$патер  “\п”; 


должен склеить вместе два хеша и две фиксированные строки, прежде чем пе- 
редать их процедурам вывода низкого уровня, тогда как: 


ргіпі $Ри1]паме{Фпате}, ” һаѕ а пем Поте бігестогу ", 
фһоте{$пате}, “\п”; 


не должен. С другой стороны, в зависимости от значений и архитектуры кон- 
катенация может оказаться быстрее. Проверьте сами. 


• Предпочитайте јоіп(””, ) ряду операций конкатенации строк. Множествен- 
ная конкатенация может привести к многократному копированию строк в па- 
мяти. Оператор јоіп позволяет избежать этого. 
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® 5р1ії с фиксированной строкой обычно быстрее, чем 5р1ії с шаблоном. Поэто- 
му используйте 5р111(/ / ) вместо 5р111(/ +/, ...), если знаете, что пробел 
будет только один. Однако шаблоны /\5+/, /7/ и/ / специально оптимизирова- 
ны, как и особый 5р11ї по пробельным символам. 


• Упреждающее увеличение массива или строки может сберечь время. По мере 
роста строк и массивов Реті увеличивает их, размещая в памяти новый экзем- 
пляр с некоторым запасом для роста и копируя прежние значения. Упреж- 
дающее увеличение строки оператором х или массива установкой значения 
фнаггау способны предотвратить такие накладные расходы и уменьшить фраг- 
ментацию памяти. 


» Неприменяйте ипает к длинным строкам и массивам, если они будут повторно 
использоваться с теми же целями. Это помогает предотвратить повторное вы- 
деление памяти, когда строку или массив потребуется повторно увеличить. 


» Предпочитайте запись "\0" х 8192 вызову ипраск(“х8192”, ()). 


• зузтет(`пко1г...”) может оказаться быстрее для набора каталогов, если систем- 
ный вызов тёай' недоступен. 


• Избегайте применения функции е0+, если возвращаемые значения уже указы- 
вают на конец файла. 


• Кэшируйте записи из файлов, которые могут многократно использоваться 
(например, раззша и &тоир). Особенно важно кэшировать записи, полученные 
по сети. Например, для кэширования значений, возвращаемых 0еїћоѕїручбд 
при преобразовании числовых адресов (таких как 204.148.40.9) в имена (такие 
как «ууү.огеШу.сот»), можно использовать что-то вроде: 


$и6 питтопате { 
10са1 ($) = ©; 
ип1е5$ (деЕпед $питопате{$_}) { 
ту(@а) = деїпоѕіруадаг(раск( "4", ър1ії(/\./)), 2), 
$питсопате{$_} = @а > 0 ? $а[0] $; 
} 
гефигп $питтопате {$_}. 
} 


• Избегайте лишних системных вызовов. Вызовы операционной системы обхо- 
дятся довольно дорого. Поэтому, например, не вызывайте оператог. {1те, если 
можно обойтись кэшированным значением $пом. Используйте специальный 
дескриптор файла _, чтобы избежать ненужных вызовов $1982). В некоторых 
системах даже простейший системный вызов может быть связан с выполне- 
нием тысяч инструкций. 


• Избегайте ненужных вызовов ѕуѕіетп. Функция ѕуѕїеп запускает подпроцесс, 
чтобы выполнить указанную программу или, что еще хуже, может вызвать 
интерпретатор команд. Это легко может обернуться выполнением миллионов 
инструкций. 

• Остерегайтесь запуска подпроцессов, если это происходит часто. Запуск одно- 
го процесса рша, Возтате или Нпа не сильно вам повредит — в конце концов, 
интерпретатор занимается запуском подпроцессов постоянно. Можете не ве- 
рить, но мы иногда поощряем подход «ящика с инструментами». 
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Самостоятельно отслеживайте рабочий каталог, избегая многократных вызо- 
вов рша. (Для этого имеется стандартный модуль. См. Сид в главе 28.) 


Избегайте использования в командах метасимволов интерпретатора, если это 
уместно, передавайте в ѕуѕїеп и ехес готовые списки. 


Устанавливайте «липкий» (ѕііску) бит на интерпретатор Регі в системах, не 
поддерживающих подкачку по запросу: 


сһтод +6 /иѕг/біп/рег1 


Заменяйте вызовы ѕуѕїеп неблокирующими вызовами ореп с каналами. Чи- 
тайте ввод по мере его поступления, не ожидая, пока порожденный процесс 
завершится. 


Используйте асинхронную обработку событий (АпуЕуепт, Сого, РОЕ, беагтап и дру- 
гие), чтобы решать несколько задач одновременно. Современные компьютеры 
обычно имеют несколько процессоров, по несколько ядер на каждый. Некото- 
рые события могут просто ждать ответа от сети, блокируя программу и не да- 
вая ей заниматься другими делами. А некоторые могут быть обусловлены бло- 
кирующими вызовами $уѕїеп. 


Эффективность по памяти 


Минимизируйте области видимости переменных, чтобы они не занимали па- 
мять, когда в них нет потребности. 


Для компактного хранения массива целых чисел можно использовать функ- 
цию \ес, если целые числа имеют фиксированную ширину. (Целые числа пе- 
ременной ширины можно хранить в строке ОТЕ-8.) 


Числовые значения предпочтительнее эквивалентных строковых значений — 
они занимают меньше памяти. 


Используйте зи0$1г, чтобы хранить строки постоянной длины в более длинной 
строке. 


Для компактного хранения массива хешей, если длина ключа и значения 
фиксированы, применяйте модуль Т1е::5005*гНаѕћ. 


Используйте __Е\0__ и дескриптор файла ПАТА, чтобы избежать хранения дан- 


ных программы одновременно в виде строки и массива. 
Применяйте еасп вместо Кеуз, если порядок не имеет значения. 


Удаляйте или делайте неопределенными неиспользуемые глобальные пере- 
менные. 


Организуйте хранение хешей в каком-нибудь файле ОВМ на диске. 
Сохраняйте массивы во временных файлах. 


Используйте каналы для передачи обработки другим инструментам. Они очи- 
щают свою память по завершении работы. 


Избегайте списочных операций и загрузки файлов целиком в память. 


Избегайте 1'///. Для каждого выражения 1г/// приходится хранить объеми- 
стую таблицу трансляции. 
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Не разворачивайте циклы и старайтесь обойтись без подстановки (іпіпе) под- 
программ. 


Используйте Гі1е::Мар для чтения файлов, если их содержимое не требуется 
изменять (и иногда даже если это необходимо). 


Избегайте рекурсии. Ре! не выполняет «хвостовую» оптимизацию, посколь- 
ку является динамическим языком. Вы сами должны уметь преобразовывать 
рекурсию в циклический алгоритм, как это делают языки, способные выпол- 
нять «хвостовую» оптимизацию. 


Для эффективности программирования 


Наполовину идеальная программа, работающая уже сегодня, лучше совершенно 
идеальной программы, которая будет готова только через месяц. Временные про 
блемы допустимы.! Некоторые из следующих советов противоречат тем, что да- 
вались выше. 


Загляните в СРАМ, прежде чем писать свой код. 


Загляните в СРАМ еще раз. Возможно вы что-то пропустили. Поспрашивайте 
у окружающих. 


Используйте значения по умолчанию. 

Применяйте клёвые сокращенные ключи командной строки, такие как -а, -п, 
-р, -$ м -1. 

Используйте Гог в смысле Ғогеасћ. 

Выполняйте системные команды посредством обратных апострофов. 
Используйте <> и тому подобное. 

Старайтесь работать с шаблонами, создаваемыми на этапе выполнения. 
Щедро используйте в своих шаблонах *, + и {}. 

Обрабатывайте целые массивы и загружайте файлы целиком в память. 
Используйте детс. 

Используйте $`, $8 и $. 


Не проверяйте значения ошибок в ореп, так как <НАМОЕЕ> и ргіпї НАМОЕЕ ведут 
себя просго как пустые операции, если им передан неверный дескриптор. 


Не вызывайте с10$е для своих файлов — они будут закрыты при очередном вы- 
зове ореп. 


Не передавайте подпрограммам аргументы. Используйте глобальные пере- 
менные. 


Не давайте имен параметрам подпрограмм. К ним можно обращаться непо- 
средственно как к $ [ХРА]. 


Используйте первое, что придет в голову. 


Заставьте кого-нибудь сделать половину работы за вас, выложив недоделан- 
ный код на Сіїћир (ћіёр://илло.рійћиф.сот). 


Так называемые «технические недоработки», которые не всегда являются чем-то ужас- 
ным. 
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Для эффективности сопровождения 


Код, который вы (и ваши коллеги) собираетесь использовать и развивать в буду- 
щем, заслуживает большего внимания. Замените выгоды в краткосрочной пер- 
спективе преимуществами в долгосрочной перспективе. 


Не используйте значения по умолчанию. 
Используйте ГогеасН в смысле Гогеаси. 

Используйте осмысленные метки циклов в пехї и 1аѕї. 
Давайте осмысленные имена переменным. 

Давайте осмысленные имена подпрограммам. 


Начинайте строку с того, что важно, используя апа, ог и модификаторы ко- 
манд (такие как ехії 1 $0опе). 


Закрывайте файлы, закончив с ними работу. 

Используйте пакеты, модули и классы, чтобы скрыть детали реализации. 
Реализуйте осмысленный АРІ. 

Передавайте аргументы как параметры процедурам, 

Именуйте параметры процедур с помощью пу. 

Расставляйте круглые скобки для ясности. 

Расставляйте побольше (полезных) комментариев. 

Внедряйте в код рой-документацию. 

изе магп1пдз. 

иѕе зігісї. 

Пишите тесты, покрывающие как можно больший процент кода (см. главу 19). 


Для эффективности переноса на другие платформы 


Помашите приличными чаевыми перед носом носильщика. 


Избегайте функций, которые не везде реализованы. Проверить, какие из них 
доступны, можно с помощью еуа]. 


Используйте модуль Сопѓід или переменную $70, чтобы узнать тип машины. 
Добавляйте инструкции и5е у5.хх, чтобы обозначить требуемую версию Рег]. 


Не пользуйтесь новыми возможностями языка только затем, чтобы блеснуть 
эрудицией. 

Не рассчитывайте, что на неизвестной машине будут успешно выполняться 
раск и ипраск для чисел с плавающей запятой в родном для нее формате. 
Используйте сетевой порядок байтов (форматы "п" и “№ для расК) при отправке 
двоичных данных по сети. 

Не посылайте двоичные данные по сети. Посылайте АЗСП. Лучше посылать 
ОТЕ-8. Еще лучше посылать деньги. 


Используйте стандартные или распространенные форматы представления дан- 
ных, такие как ЈЗОМ№ или УАМТ, для обмена информацией. 
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Проверяйте $] или $`\, чтобы узнать, поддерживает ли текущая версия все ис- 
пользуемые вами возможности. 


Избегайте применения $] и $`У. Используйте гедилге или изе с номером версии. 


Применяйте «хак» еүа] ехес, даже если вы не используете его для обеспечения 
работоспособности программы на тех редких системах, где интерпретаторы 
команд не распознают обозначение #!. 

Начинайте программу строкой #1! /и5г/біп/рег1, даже если вы не используете ее. 
Проверяйте варианты команд ОМІХ. Некоторые программы 1114, например, 
не умеют обрабатывать ключ -хаер. 

Избегайте команд ОМТХ, если те же операции можно выполнить встроенными 
средствами. Команды ОМХ не слишком хорошо работают в М8-рО5 или УМБ. 


Помещайте все свои сценарии и страницы руководства в одну сетевую файло- 
вую систему, которая смонтирована на всех ваших машинах. 


Опубликуйте свой модуль в СРАМ. Вы получите массу откликов, если он ока- 
жется не переносимым на другие платформы. 


Дайте другим возможность помочь вам, используйте общедоступные системы 
управления версиями, такие как Сіёһир (##р://шши.виПиб.сот). 


Для эффективности использования 


Сделать проще жизнь других людей намного сложнее, чем упростить задачу себе. 


Не заставляйте набирать строку за строкой, дайте им возможность применить 
любимый редактор. 


А лучше используйте графический интерфейс, созданный с помощью такого 
расширения, как Рей/Тк или Их, где пользователи смогут контролировать по- 
рядок событий. 


Дайте пользователям возможность что-нибудь почитать, пока программа ра- 
ботает. 


Используйте автозагрузку, чтобы казалось, будто программа работает быстро. 


Предоставьте возможность получать полезные сообщения в любом приглаше- 
нии командной строки. 


Выводите сообщение о правилах работы. если пользователь ввел некоррект- 
ные данные. 


Включайте расширенные примеры в документацию и включайте примеры за- 
конченных программ в дистрибутив. 


Показывайте действие по умолчанию в каждом приглашении и, возможно, 
несколько альтернатив. 


Предусмотрите значения по умолчанию для новичков. Разрешите опытным 
пользователям изменять значения по умолчанию. 


Используйте для ввода один символ, если это имеет смысл. 


Организуйте взаимодействие с пользователем по образцам, с которыми он 
(пользователь) знаком. 
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• Сделайте так, чтобы из сообщения об ошибке было понятно, что именно требу- 
ется исправить. Включайте всю относящуюся к делу информацию, в том чис- 
ле имя файла и код ошибки, например: 


ореп(ЕТЕЕ, $111е) ог 91е “$0: Невозможно открыть $111е для чтения: $!\п" 


« Используйте Гогк && ехії, чтобы отключиться (отсоединиться) от терминала, 
если оставшаяся часть сценария выполняет пакетную обработку. 


• Разрешите передавате аргументы из командной строки или через стандартное 
устройство ввода. 


• Используйте конфигурационные файлы в простом текстовом формате. 
В СРАМ имеется масса модулей, поддерживающих такую возможность. 


• Не устанавливайте произвольных ограничений в своей программе. 
• Предпочитайте поля переменной длины полям фиксированной длины. 
• Используйте сетевые протоколы, ориентированные на текст. 


• Посоветуйте всем остальным использовать сетевые протоколы, ориентирован- 
ные на текст! 


• Посоветуйте всем остальным советовать всем остальным использовать сете- 
вые протоколы, ориентированные на текст!!! 


• Будьте ленивы во благо других. 
• Будьте вежливы. 
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Безусловно, у каждого есть свои предпочтения в плане форматирования исходно- 
го текста программы, но существуют некоторые общие принципы, которые по- 
зволяют облегчить чтение, понимание и сопровождение программ. Ларри озву- 
чил некоторые общие рекомендации в регіѕіџіе, но это всего лишь рекомендации. 
Возможно, вам также понравятся идеи, изложенные в книгах «Рей Веѕі Ргас- 
іісез» и «Модегп Регі1». 


Симое важное — запускать программы с директивами ѕ+гісї и магпіпоѕ, если нет 
веских причин не делать этого. Если потребуется отключить их, используйте ди- 
рективу по, распространив ее действие на как можно меныпую область видимо- 
сти. Полезными могут также оказаться директивы $101гар и даже 091а0910511с$. 


В отношении эстетики оформления кода едва ли не единственное. о чем сильно 
беспокоится Ларри, это чтобы закрывающая фигурная скобка многострочного 
блока имела отступ и была выровнена по ключевому слову, начинающему конст- 
рукцию. Помимо этого, у него есть другие предпочтения, которые не столь кри- 
тичны. Примерам данной книги (должны быть) свойственны следующие согла- 
шения по форматированию: 


• Использование отступов в четыре колонки. 


• Открывающая фигурная скобка должна по возможности находиться в той же 
строке, что и предшествующее ключевое слово; в противном случае фигурные 
скобки следует выравнивать по вертикали: 


мһі1е ($сопаітіоп) { # для коротких - выравнивать по ключевым словам 
# какие-то действия 
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} 


# если условие переносится, выравнивать фи губные скобки по вертикали 
мћі1е ($1һіѕ сопдітіоп апа $һа+_сопдіїіоп 
апа $15 оїһег_1опо_сопдіїТіоп) 
{ 
# какие-то действия 

} 
Ставьте пробел перед открывающей фигурной скобкой многострочного блока. 
Короткий блок можно поместите в одной строке вместе с фигурными скобками. 
Опустите точку с запятой в коротком однострочном блоке. 
Возьмите за правило окружать операторы пробелами. 
Окружайте «сложный» индекс (внутри квадратных скобок) пробелами. 


Помещайте пустые строки между фрагментами кода, выполняющими разные 
функции. 


Разделяйте закрывающую фигурную скобку и е1ѕе посредством перевода 
строки. 


Не ставьте пробел между именем функции и открывающей круглой скобкой. 
Не ставьте пробел церед точкой с запятой. 
Ставьте пробел после каждой запятой. 


Переносите длинные строки после оператора (но перед апс или ог, даже в виде 
ёби ||). 


Выравнивайте соответствующие элементы по вертикали. 


Опускайте избыточные символы пунктуации, если при этом не страдает яс- 
ность. 


У Ларри есть обоснования для каждого из этих пристрастий, но он не утвержда- 
ет, что у всех остальных голова работает (или не работает) так же, как у него. 


Вот несколько еще более существенных соображений относительно стиля: 


Если нечто может быть сделано определенным образом, это еще не значит, что 
вы должны сделать это именно так. Рег! может дать несколько способов сделать 
что-то, поэтому выберите тот, который лучше всего читается. Например: 


ореп(РО0, $00) || 91е "Сап'ї ореп $#оо $! "; 
лучше чем: 
(1е “Сап ореп ФҒоо: $!’ ип1езз ореп(РОО, $Роо); 


потому что второй способ скрывает основной смысл команды в модификаторе. 
Опять же, 


ргіпі “Зжаг1па апа1уѕіѕ\п” 1 $уегбозе; 
лучше, чем 
$уегроѕе апа рглпт "Ѕтагтіпо апа1уѕіѕ\п”; 


поскольку главное не в том, ввел пользователь -р или нет. 
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• Аналогично, если оператор допускает аргументы по умолчанию, это не значит, 
что вы должны использовать значения по умолчанию. Они существуют для ле- 
нивых программистов, которые пишут программы «одним махом». Если вы хо- 
тите, чтобы вашу программу можно было читать, снабжайте ее аргументами. 


• Аналогично, возможность опускать круглые скобки во многих местах не оз- 
начает, что это делать обязательно: 


гефигп ргіпї геуегѕе 50:1 пип уа1иеѕ Фаггау; 
гефигп ргіпі(геуегѕе(ѕогі пит (ма1иеѕ(%аггау)))); 


Если есть сомнения, ставьте круглые скобки. Как минимум, они позволят ка- 
кому-нибудь несчастному понажимать клавишу % в 1%. 


Даже если у вас нет сомнений, подумайте о тех, кому придется сопровождать 
код после вас и кто может поставить круглые скобки в неверном месте. 


• Не следует прибегать к специальным уловкам, чтобы выйти из цикла р начале 
или конце блока. Ре] предоставляет оператор 1а51, обеспечивающий возмож- 
ность выхода в любой точке. Отступ сделает его более заметным: 


ІІМЕ: 
Рог (;;) { 
Ѕїаїетьпїі$; 
1аѕі ІІМЕ 1? $#оо; 
пех ШІМЕ 11 /7#/; 
ЗТатетепе$; 
} 


• Не бойтесь использовать метки циклов — они служат улучшению читаемости, 
атакже позволяют предусмотреть выходы из многоуровневых циклов. См. толь- 
ко что привеленный пример. 


• Избегайте применения огер, пар и обратных апострофов в пустом контексте, 
т.е. если возвращаемые ими значения просто отбрасываются. У всех этих 
функций есть возвращаемые значения, поэтому используйте их. В противном 
случае следует предпочесть цикл ' згеасћ или функцию ѕуѕїеп. 


• Для лучшей переносимости кода, использующего функции, которые могут 
быть не реализованы в некоторых системах, проверьте конструкцию в е\а1, 
чтобы убедиться, что вызов будет успешным. Зная номер версии или уровень 
исправлений (рафсЬ 1еуе]), обеспечивающие поддержку требуемой возможно- 
сти языка, можно проверить $] (ФРЕВІ _\МЕВЗТОМ в модуле Епо1151), чтобы узнать, 
присутствует ли эта возможность. Модуль (опѓід также позволяет запросить 
значения, которые определила программа Сопйдиге при установке Рей. 


• Давайте переменным и функциям мнемонические имена. Если вы не можете 
вспомнить, что это за мнемоника такая, у вас проблема. 


• Хотя короткие идентификаторы типа $9011 не вызывают возражений, для 
разделения слов лучше использовать символ подчеркивания. Как правило, 
значительно легче прочесть $уаг_патез_11ке_1113, чем $\Уагћатеѕі 1 кетћіѕ, особен- 
но тем, для кого английский не является родным языком. Кроме того, такое 
же правило относится к $\АН_МАМЕЗ_ЕТКЕ_ТНТ$. 


Имена пакетов иногда являются исключениями из этого правила. Рей] нефор- 
мально резервирует имена модулей в нижнем регистре для модулей директив, 
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таких как іпіедег и ѕїгісі. Имена других модулей должны начинаться с за- 
главной буквы и содержать символы разных регистров, но, возможно, не долж- 
ны включать символы подчеркивания из-за ограничений длины имен в при- 
митивных файловых системах. 


• Может оказаться целесообразным использовать регистр букв для указания 
области видимости или природы переменных. Например: 


ФА. САРЅ НЕВЕ # только констангы (бойтесь конфликтов с переменными Рег]! ) 
$Зоте_Сар$_Неге # глобальные/статические переменные пакета 
фпо_сарѕ ћеге # переменные области видимости функции ту() или 1оса1() 


По различным неочевидным причинам имена функций и методов лучше всего 
служат, когда полностью записаны в нижнем регистре. Например, $обј->аѕ_ 
5+гіпо(). 


Добавив ведущий символ подчеркивания, можно указать, что переменная 
или функция не должны использоваться вне пакета, в котором они определе- 
ны. (Рей не требует соблюдения этого правила, это просто форма документи: 
рования.) 


• Если встретилось действительно сложное регулярное выражение, используй- 
те модификатор /х и добавьте пробельные символы, чтобы оно меньше походи- 
ло на белый шум. 


• Не используйте косую черту в качестве разделителя, если в регулярном выра- 
жении уже слишком много прямых и обратных косых черт. 


• Не используйте кавычки в качестве разделителя, если в строке уже есть ка- 
кие-либо кавычки. Примените псевдофункции 0//, 94// или дх//. 


• Операторы апі и ог избавляют от необходимости заключать в круглые скобки 
списочные операторы и позволяют отказаться от избыточных операторов пунк- 
туации типа &8 и ||. Вызывайте свои подпрограммы, как если бы они были 
функциями или списочными операторами, чтобы избежать лишних амперсан- 
дов и круглых скобок. 


» Используйте внедренные документы вместо многократного повторения ко- 
манды ргіпї. 

• Выравнивайте однотипные элементы по вертикали, особенно если они слиш- 
ком длинны и не умещаются в одной строке: 


$10Х = $57 МТІМЕ; 

$Т0Х = $57 _АТІМЕ 1? форт_и; 

$І0Х = $5Т СТІМЕ 1? $орЕ с; 

$ТОХ = $51 $Т2Е 11 $орї 5; 

тка1г($1ироіг, 0700) 11 діе “сап’ ткдіг $1трдіг: $!°, 
сһаіг(Фтрдіг) || іе "сап`4 сһаіг $1траіг: $1"; 
пкаіе("Етр", 0777) || діе “сап' ткаіг $№трдіг/тр: $1”: 


• Истина, которую мы повторим трижды: 
Обязательно проверяйте значения, возвращаемые системными вызовами. 


Обязательно проверяйте значения, возвращаемые системными вызовами. 


ОБЯЗАТЕЛЬНО ПРОВЕРЯЙТЕ ЗНАЧЕНИЯ, ВОЗВРАЩАЕМЫЕ СИСТЕМ- 
НЫМИ ВЫЗОВА МИ! 


Беглый разговор на Реп 671 


Сообщения об ошибках должны выводиться в ЗТОЕВВ и указывать, какая про 
грамма создала проблему, какой вызов при этом выполнялся и скакими ар- 
гументами. Важно, чтобы сообщения об ошибках для системных вызовов со- 
держали стандартные системные сообщения. Вот простой, но показательный 
пример: 


орепаіг(0, $91г) || діе "Невозможно выполнить орепадіг $0іг: $!° 


Обязательно проверяйте возвращаемые значения. 
• Выравнивайте транслитерации, когда это имеет смысл: 


їг [абс] 
[ху21; 


• Думайте о повторном использовании кода. Зачем тратить умственные усилия 
на одноразовый сценарий, если что-нибудь подобное может понадобиться по- 
том снова? Попробуйте обобщить свой код. Рассмотрите возможность созда- 
ния модуля или класса объектов. Заставьте свой код чисто выполняться в об- 
ласти действия џ56 ѕігісї и -м. Рассмотрите возможност» бесплатного распро- 
странения своего кода. Попробуйте измените свой взгляд на мир. Попробуй- 
те... а-а, не обращайте внимания. 


• Используйте модуль Рег1::Тійу для форматирования кода и модуль Рег1::Сгіїіс 
для поиска возможных программных ошибок. 


• Будьте последовательны. 
• Будьте вежливы. 


Беглый разговор на Рей 


Мы коснулись нескольких идиом в предшествующих разделах (не говоря уже 
о предыдущих главах), но есть много других идиом, которые часто встречаются 
в коде опытных программистов на Рег]. Говоря об идиоматическом Ре! в данном 
контексте, мы имеем в виду не набор произвольных выражений с окаменевшими 
значениями. Скорее мы имеем в виду код, который показывает понимание обще- 
10 строя языка, что и когда вам может сойти с рук и что вам это даст. 


Мы не рассчитываем перечислить все идиомы, которые могут вам встретиться, — 
для этого потребовалась бы еще одна такая же большая книга. Или две. (См. на- 
пример «Ре СооКБооК»'!). Но вот несколько важных идиом, где «важных» озна- 
чает «вызывающих внезапную истерику у человека, считающего, что ему извест- 
но, какими должны быть языки программирования». 


• Используйте => вместо запятой, если это улучшит читаемость: 
гетигп 61езз $теѕѕ => $с1а55; 


Что означает «освятить эту «мешанину» (тез$) в указанный класс». Остере- 
гайтесь применять => после слова, которое не должно автоматически заклю- 
чаться в кавычки: 


1 Т. Кристиансен, Н.Торкингтон «Рег: библиотека программиста». — Пер. сангл. — СПб.: 
Питер, 2001. 
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ѕир Ғоо () { “2700” } 
ѕир баг () { ‘ВАН’ } 
ргіпЕ Ёоо => баг; # выведет ҒооВАЯ, а не РООВАВ; 


Хорошо также использовать => рядом с литеральной запятой, разглядеть кото- 
рую может быть нелегко: 


101п(”, ” => @аггау); 


Рен дает возможность решать задачи несколькими способами, чтобы вы мог- 
ли проявить свои творческие возможности. Проявляйте их! 


в Используйте местоимение в единственном числе для улучшения читаемости: 


Гог (@1іпеѕ) { 
$ = “п; 
} 


Переменная $_ является в Рег! вариантом личного местоименин. Поэтому при- 
веденный код означает «возьмите каждую строку и прикрепите к ней символ 
перевода строки». В наши дни можно даже записать это так: 


$ = "п" Гог @1іпеѕ: 


Местоимение $ настолько важно в Регі, что его употребление обязательно 
в огер и пар. Вот способ кэшировать часто встречающиеся результаты выполне- 
ния функции ехрепѕіме: 


Усаспе = тар { $_ => ехрепѕіуе($_) } @соттоп_агдз; 
$х\а1 = $саспе{$х} || ехрепѕіме($х); 


• Для дальнейшего улучшения читаемости опустите и местоимение ( {_ ).1 
• Используйте операторы управления циклами с модификаторами инструкций. 


мпі16 (<>) { 
пехі і? /7=Ғог\ѕ+(1іпдех |1а?ег)/; 
фсһагѕ += Іепдїһ; 
фмогдѕ += эре; 
$1іпеѕ += у/\п//; 
} 


Этот фрагмент мы использовали для подсчета страниц в данной книге. Когда 
приходится выполнять много работы с одной и той же переменной, часто луч- 
ше читается код вообще без местоимений. 


Этот фрагмент демонстрирует также идиоматическое использование пехї с мо- 
дификатором для закорачивания цикла. 


Переменная $_ всегда служит управляющей переменной цикла в дгер и пар, но 
ссылка программы на нее часто является неявной: 


©һаѕ1еп = дгер { 1Іепдіһ } @гапаоп; 


Здесь мы выбираем из списка скаляров только те значения. длина которых 
больше нуля. 


1 В данном разделе несколько пунктов списка относятся к одному последующему при- 
меру, поскольку некоторые наши примеры иллюстрируют сразу несколько идиом. 


Беглый разговор на Рей 673 


• Используйте Гог для установки антецедента местоимения: 


Гог ($еріѕоде) { 
з/ёгеа/рагпеу/9; 
5/міїта/беї+у/д, 
ѕ/реро1еѕ/Батрат/а; 

} 


Что из того, что в цикле только один элемент? А то, что это удобный способ 
«настроить» местоимение, т.е. $ . В лингвистике это называется установкой 
темы (іорісаітаііоп) и служит не обману, а коммуникации. 


• Неявно ссылайтесь на местоимение во множественном числе, @ . 
• Используйте операторы управления для установки значений по умолчанию: 


ѕџб багк { 
пу 009 $5рої = ѕһіғї; 
ту $дџа1іту = зе || “уарр1пд”; 
пу $аџапіїу = $11 || “попзфор“ 


} 


Здесь мы неявно используем другое местоимение Ре, @_, которое означает 
«они, их» (ћет). Аргументы всегда передаются функции как «они». Оператор 
ЭРАЕЕ знает, что нужно выполнить действие над содержимым ©_, если она опу- 
щена. Он действует так же, как оператор аттракциона в Диснейленде, кото- 
рый выкрикивает «Следующий!», не указывая конкретно, кто будет этим сле- 
дующим. (Бессмысленно указывать пальцем, потому что имеется очередь.) 


Хотя «по происхождению» оператор || является логическим, он позволяет ус- 
танавливать значения по умолчанию, поскольку Рег] возвращает первое истин- 
ное значение. Программисты часто бесцеремонно обращаются с истиной; при- 
веденная строка не даст желаемого результата, если, например, передать значе- 
ние для диапеу, равное нулю. Но если вы не собираетесь назначать ўдџа1іїу 
или $`џапїіїу булево значение, идиома работает прекрасно. Нет смысла впадать 
в суеверия и расставлять повсюду деѓіпей и ехіѕїѕ. Просто нужно понять, что 
она делает. Пока случайно не будет получено ложное значение, все хорошо. 


Если, по вашему мнению, ложное значение все-таки может быть получено 
случайно, используйте оператор «определено-ИЛИ» //: 


иѕе \5. 10 
зиб Багк { 
ту 009 $5роф = 5һіҒ+; 
ту фаџа1іїу = 5һіғЕ // “уарр1пд”; 
ту $диапііїу = $һ1ғі // “попѕїор"; 
} 


® Используйте комбинированные операторы с присваиванием, в том числе в ка- 
честве операторов управления: 


$хуа1 = $саспе{$х} ||= ехрепѕіме($х); 


Здесь мы вовсе не инициализируем наш кэш. Мы просто полагаемся на то, что 
оператор ||= вызовет ехрепз1\е($х) и присвоит результат $сасНе{$х}, только если 
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фсасће{$х} имеет ложное значение. Результатом будет новое значение, которое 
получит $саспе{$х}. Снова мы бесцеремонно обращаемся с истиной, посколь- 
ку если поместить в кэш ложное значение, функция ехрепзіуе($х) будет вызва- 
на снова. Возможно, программиста это вполне устраивает, поскольку вызов 
ехрепз1уе($х) обходится дешево, когда эта функция возвращает ложное значе- 
ние. А может быть, программист знает, что ехреп$1ме($х) вообще не способна 
вернуть ложное значение. А может быть, программист просто неряшлив. Не- 
ряшливость можно считать за форму творчества. 


• Используйте операторы управления циклом как операторы. а не как инструк- 
ции. И... 


» Используйте запятые как «маленькие» точки с запятой в небольшом блоке: 


мһі1е (<>) { 
$соттепе$++, пехі ЇР /7#/; 
$01апк++, пехе ТЕ /7\5*$/, 
1а8ї ЇР Г Е; 
$соде+ + 


} 


ргапт “соттепт = $соттепт®\пЬапк = $Ы]апк\псоде = фсоде\п”; 


Здесь демонстрируется понимание того факта, что модификаторы инструкций 
модифицируют инструкции, а пехї является просто оператором. Здесь показа- 
но также идиоматическое использование запятой для разделения выраже 
ний, во многом сходное с обычным употреблением точки с запятой. (Различие 
в том, что запятая удерживает два выражения в составе одной инструкции 
под контролем одного модификатора команды.) 


е Используйте возможность управления потоком выполнения в своих интересах: 


мһі1е (<>) { 
ГЖ/ апа фсоттепіѕ++, пехі 
/^\8*$/ апа $01апк++. пех*; 
/^__Е№О__/ апа 1аѕї; 
фсойе++" 


} 


ргіпе “соттепе = ФсоттепЕз\пЬ1апк = $01апк\псоде = $соде\п” 


Это тот же самый цикл, на этот раз с шаблонами в начале. Проницательный 
программист на Рен поймет, что этот цикл компилируется в те же внутренние 
коды, что и предыдущий пример. Модификатор ії является просто обратной 
конъюнкцией апа (или 84), а модификатор ип1еѕѕ — обратной дизъюнкцией ог 
(или ||)- 


• Используйте неявные циклы, создаваемые ключами -п и -р. 
• Не ставьте точку с запятой в конце однострочного блока: 

н! Иизг/б1п/Ирег1 п 

$соттепіѕ++, пехї ІІМЕ 17 /#/; 

$61апк++, пех ИМЕ іР /7\5*$/; 


1аѕї МЕ 1Р /7__ЕМ_/ 
$соде++; 


ЕМО { рг1пе “соттепт = Фсомтепез\п61апк = $61апк\псоде = $соде\п” } 


Беглый разговор на Рей 675 


Это, в сущности, та же программа, что и выше. Мы поместили метку | ІМ№Е в опе- 
раторы управления циклом по собственному желанию, а не из-за реальной не- 
обходимости, так как неявный цикл ПМЕ, создаваемый ключом -п, является 
самым глубоким вложенным циклом. Мы использовали ЕО, чтобы вывести за- 
вершающую команду за пределы неявного основного цикла, так же как ваш. 


• Применяйте внедренные документы. когда печать становится устрашающей. 
• Используйте осмысленный разделитель для внедренного документа: 


ЕМО { ргіпі <<"СО0МТЅ" } 
сотпепё = Фсоттепт$ 
р1апк = $61апк 

соде = $соде 

СО0МТ5 


Вместо нескольких инструкций вывода программист, свободно пишущий на 
Рен, использует строку с интерполяцией, занимающую несколько строк. И не- 
смотря на то что ранее мы назвали это Распространенной Ошибкой, здесь мы 
без зазрения совести пропустили завершающую точку с запятой, потому что 
она не обязательна в конце блока Е№. (Если когда-нибудь мы преобразуем вне- 
дренный документ в многострочный блок, то вернем точку с запятой на место.) 


• Выполняйте подстановку и трансляцию со скалярами «на проходе»: 
($пем = $019) =- 3/бад/9009/9; 
или используйте модификатор /г, чтобы вернуть результат: 
фпем = $010 =- $/щад9/д009/дг; 
Поскольку 1-значениям можно присваивать значения, вы часто будете встре- 
чать конструкции, меняющие значения «на проходе», т.е. во время присваива- 


ния. На практике это может предотвратить внутреннее копирование (если мы 
когда-нибудь соберемся реализовать соответствующую оптимизацию): 


спотр(Фапзиег = «ТІМ ); 
Любая функция, модифицирующая аргумент на месте, может использоваться 
в приеме «на проходе». Но погодите, это еще не все! 
• Не ограничивайтесь изменением скаляров на проходе: 
ог (@пем = @о1а) { 5/баа/дооа/9 } 
Здесь мы копируем 0@010 в ёпем, изменяя все на ходу (не все сразу, конечно, — 
блок выполняется многократно, каждый раз с новым значением). 
• Передавайте именованные параметры с помощью красивого оператора запя- 
ТОЙ =>, 
• Предоставьте обработку аргументов операции присваивания хешу: 


ѕир багк { 
пу 006 $5рої = эй, 
пу Урагп = © 


ту $аџа1іїу = $рагт{оуАЦІТҮр || “уаррілд"; 
пу Фанат {у = Фрагт{ОЏАМТІТҮ} || “попзфор” 
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$ғідо->багк( ОЦАМТТТУ => “опсе“, 
ОЏАШІТҮ => “моб” ); 


Именованные параметры часто являются роскошью (которую можно себе по- 
зволить). А в Ре! вы получаете их даром, если не считать стоимость присваи- 
вания хещу. 


• Повторяйте логические выражения до получения ложного значения. 
• Используйте минимальные квантификаторы в шаблонах, если это возможно. 
• Используйте модификатор /е для вычисления выражения замены: 


#1 /иѕг/оіп/рег1 -р 
1 мһі1е $/7(.*+2)(\1+)/$1 "7" х (1еподїћ($2) * 4 - 1еподїћ($1) % 4)/е; 


Эта программа исправляет файлы, получаемые от того, кто ошибочно полага: 
ет, что может переопределить аппаратную табуляцию так, чтобы она занима- 
ла 4 пробела, а не 8. В ней используется несколько важных идиом. Во-первых, 
идиома 1 имй11е удобна, когда все, что вы хотите делать в цикле, фактически 
осуществляется в условии. (Ре! достаточно сообразителен, чтобы не преду- 
преждать об использовании 1 в пустом контексте.) Необходимо повторять эту 
подстановку, поскольку каждый раз, заменяя несколько символов табуляции 
пробелами, приходится пересчитывать позицию колонки следующей табуля- 
ции от начала. 


Выражение (.*?) ищет кратчайшую строку до первой табуляции, используя 
минимальный квантификатор (знак вопроса). В данном случае мы могли при- 
бегнуть к обычному жадному поиску *• следующим образом: ([^\@*). Но это 
срабатывает только потому, что табуляция является одиночным символом, 
а значит, можно использовать отрицание класса символов, чтобы не «проско- 
чить» мимо первой табуляции. В целом, минимальный поиск значительно эле- 
гантнее и сохраняет работоспособность, даже если следующее найденное соот- 
ветствие окажется длиннее одного символа. 


Модификатор /е осуществляет подстановку, используя выражение, а не про- 
сто строку. Это позволяет выполнять необходимые вычисления, когда это тре- 
буется. 


• Сложные подстановки требуют творческого подхода к форматированию и ком- 
ментариев: 


#1 /иѕг/біп/рег1 -р 

1 мй11е ${ 

= привязка к началу 

начало первой подгруппы 

поиск минимального числа символов 
конец первой подгруппы 

начало второй подгруппы 

поиск одной или более табуляций 
конец второй подгруппы 


( 


.*? 


м+ 


М 
3-Е 6-5 


ту $ѕрасе1еп = 1епдтп($2) * 4; п учесть полные табуляции 

фзрасе1еп -= 1еп9їһ($1) % 4; # учесть неполные табуляции 

$1." “х $ѕрасе1еп; # задать правильное число пробелов 
}ех; 
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Это, возможно, излишне, но некоторых впечатляет больше. чем предыдущий 
однострочник. Решайте сами. 


• Небойтесь применять $`, если вам того хочется: 
1 м ]е 5/(\1+)/7 х (1Іепдіћ($1) * 4 - 1епдїћ($') % 4) /е; 
Это более короткая версия, включающая $, о которой известно, что она сни- 


жает производительность. Но мы используем только ее длину, поэтому не счи- 
тается, что это плохо. 


• Используйте смещения непосредственно из массивов @- (@1 АЅТ_ МАТСН_5ТАЯТ) и @+ 
(@1 АЅТ_МАТСН_ ЕМО): 


1 ме 5/\1+/" " х (($+[0] - $-[0]) * 4 - $-[0] % 4)/е; 
Так еще короче. (Если вы не видите здесь массивов, попробуйте найти элемен- 
ты массивов.) См. @- и 6+ в главе 25. 
• Используйте е\а]1 с возвратом константы: 


3и6 15 ма11іа раїтегп { 

ту $раї = ѕһіғҒї; 

гефиги еуа1 { “" =- /фраї/; 1 } 11 0; 
} 


Совершенно необязательно, чтобы оператор ехма1 {} возвращал реальное значе- 
ние. Здесь всегда возвращается 1, если оператор выполнился до конца. Одна- 
ко, если шаблон в $раї окажется некорректным, е\а1 перехватит ошибку и вер- 
нет ипдеѓ в логическое условие оператора ||, который превратит его в опреде- 
ленный 0 (из вежливости, поскольку ипде! — тоже ложное значение, но из-за 
него кто-то может подумать, что глючит подпрограмма іѕ_уа110 раїїегп, а нам 
бы этого не хотелось). 

• Выполняйте всю грязную работу при помощи модулей. 

• Используйте фабрики объектов. 

• Применяйте обратные вызовы (саПасК). 

• Используйте стеки для слежения за контекстом. 


• Используйте отрицательные индексы для доступа к концу массива или строки: 
иѕе ХМІ : : Рагѕег; 


фр = ХМЕ: :Рагѕег->пем(5+у1е => “ѕирѕ `) 
ѕеїНапа1егѕ $р Спаг => ѕир { $0и[-1] .= $ [1] $; 


ризй @оиб 


ѕиб 1і+ега1 { 
Фо [-1] .= “<”; 
риѕћ @оиф, ^^ 


зи6 11тега1_ { 
пу $ТехЕ = рор @оит; 
фоџі[-1] .= $техї . >"; 
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Это отрывок из программы в 250 строк, с помощью которой мы преобразовали 
ХМІ-версию старой книги Саше! обратно в формат род, чтобы редактировать 
ее для этого издания в Беа Техё Еййог, перед тем как перевести в формат 
РосВоок. 


Во-первых, можно заметить, что мы использовали модуль ХМ! : :Рагзег (из СРАМ) 
для разбора разметки ХМГ, поэтому нам не пришлось думать, как это сделать. 
Это сразу сократило нашу программу на несколько тысяч строк (в предполо- 
жении, что мы заново реализовали бы на Рен все, что модуль ХМ! : :Рагзег делает 
за нас, в том числе трансляцию символов почти любого набора в кодировку 
ОТЕ-8). 

ХМІ ::Рагѕег использует идиому высокого уровня, называемую фабрикой объек- 
тов (обес Гасюгу). В данном случае это фабрика парсеров (синтаксических 
анализаторов). Создавая объект ХМ! ::Рагѕег, мы сообщаем, какой стиль интер- 
фейса анализатора нам требуется, и он создается для нас. Это отличный спо- 
соб создать приложение для тестирования, когда не ясно, какой тип интер- 
фейса окажется лучшим в конечном итоге. Стиль ѕирѕ является лишь одним 
из интерфейсов ХМ! : :Рагзег. На самом деле, это один из самых старых интер- 
фейсов и, возможно, даже не самый популярный в настоящее время. 


В строке ѕеїНапд1егѕ показан вызов метода анализатора не в указательной но- 
тации, а в нотации «косвенного объекта», которая, помимо прочего, позволяет 
опустить круглые скобки вокруг аргументов. В строке также использована 
идиома именованного параметра, которую мы видели выше. 


В этой строке показана еще одна мощная концепция — обратный вызов (са1ї- 
ЪасК). Мы невызываем анализатор для получения следующего элемента, а пред- 
лагаем ему вызвать нас. Для именованных тегов ХМГ, таких как <11іїега1>, 
этот стиль интерфейса автоматически вызывает подпрограмму с таким же 
именем (или именем с символом подчеркивания на конце для соответствую- 
щих закрывающих тегов). Но данные между тегами не имеют имен, поэтому 
мы устанавливаем обратный вызов Спаг с помощью метода зе1Напо1егз. 


Затем мы инициализируем массив @0иї, играющий роль стека для вывода. Мы 
помещаем в него нулевую строку, которая означает, что мы не получили ника- 
кого текста на данном уровне вложенности тегов (изначально 0). 


Именно теперь снова вступает в дело наш обратный вызов. Как только мы 
встретили текст, он автоматически дописывается в последний элемент масси- 
ва через идиому $0и{[-1] в обратном вызове. На уровне внешнего тега $0и1[-1] 
является тем же, что и $0010], поэтому $0040] содержит всю выводимую ин- 
формацию. (В конечном итоге. Но сначала надо разобраться с тегами.) 


Допустим, в тексте встретился тег <1іїега1>, Тогда вызывается подпрограмма 
1 Цега1, которая дописывает некоторый текст в текущий элемент @041 и про- 
талкивает новый контекст в стек @0иї. Теперь любой текст до закрывающего 
тега будет добавлен в этот новый конец стека. Наткнувшись на закрываю- 
щий тег, мы выталкиваем собранный нами текст из стека @00ї в переменную 
фгехї и дописываем оставшуюся часть преобразованных данных в новый 


1 Насамом деле ХМі::Рагѕег служит просто красивой оболочкой вокруг ХМГ-анализатора 
ехраі Джеймса Кларка (ВЁр://ехра1.зоигсеюгве.пе/). 
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(то есть старый) конец стека, результатом чего будет трансляция строки ХМІ, 
<1ітега1>ѓехі</1іїега1> в соответствующую строку род, С<ѓех?>. 


Подпрограммы для других тегов точно такие же, только другие. 
• Чтобы создать пустой массив или хеш используйте пу без присваивания. 
• Расщепляйте строку по умолчанию по пробельным символам. 


• Выполняйте присваивание спискам переменных, чтобы выбрать любое нуж- 
ное количество элементов. 


• Используйте самооживление (автовивификацию) неопределенных ссылок для 
их создания. 


• Автоинкрементируйте неопределенные элементы массивов и хешей, чтобы 
создать их. 


• Используйте автоинкрементирование хеша %зееп для определения уникаль- 
ности. 


• Используйте присваивание удобной временной пу -переменной в условном опе- 
раторе. 


• Используйте режим автоматической расстановки кавычек в скобках. 


• Применяйте альтернативный механизм расстановки кавычек для вставки 
двойных кавычек. 


• Используйте оператор ?: для переключения между двумя аргументами в ргіпїї. 
• Выравнивайте аргументы ргіпї? по их полям %: 


ту %зееп; 
мһі1е (<>) { 

ту ($а, $6, $с, $9) = эр; 

ргіп џп1еѕѕ $зееп{$а} {$5} {$с} {$9} ++, 
} 
і? (ту $1тр = Фѕееп{ ее} {Ғіе} {Гое} {Роо}) { 

ргапЕЕ 99(Зам “Рее Ғіе Кое Ғоо” [51с] %9 11те%з. \п”) 

$Етр, $їтр == 1? "6"; 

} 


Эти девять строк битком набиты идиомами. Первая строка создает пустой хеш, 
потому что мы ничего ему не присваиваем. Мы производим итерацию по вход- 
ным строкам, неявно устанавливая «это», т.е. $_, затем используем 5р11ї без 
аргументов, которая расщепляет «это» по пробельным символам. Затем выби- 
раем первые четыре слова, выполняя присваивание списку, и отбрасываем все 
остальные. Далее мы запоминаем цервые четыре слова в четырехмерном хеше, 
что автоматически создает (при необходимости) первые три элемента ссылок 
и последний элемент счетчика, который инкрементируется оператором авто- 
инкрементирования. (В области действия прагмы магп110$ автоинкрементиро- 
вание не выдает предупреждений об использовании неопределенных значе- 
ний, поскольку автоинкрементирование является допустимым способом опре- 
деления неопределенных значений.) Затем мы выводим строку, если ранее не 
встречалась строка, начинающаяся с этих четырех слов, потому что автоин- 
крементирование является постинкрементированием, которое, помимо уве- 
личения значения хеша, возвращает прежнее значение, если оно имелось. 
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По окончании цикла мы снова проверяем %ѕееп, чтобы узнать, встретилась ли 
конкретная комбинация четырех слов. Мы используем то обстоятельство, что 
литеральный идентификатор можно поместить в фигурные скобки, и он авто- 
матически будет заключен в кавычки. Иначе нам бы пришлось сказать 
$зееп{"Рее"} {"Рле"} {"тое"}{"Роо’}, что жутко долго набирать, даже если за вами 
не гонится медведь. 


Мы присваиваем результат $зееп{Рее} (іе {Гое} {оо} временной переменной до 
проверки его в логическом контексте, предоставляемом 1. Поскольку при- 
сваивание возвращает свое левое значение, мы все же можем проверить его 
истинность. Увидев пу, вы понимаете, что это новая переменная, и мы не про- 
веряем равенство, а выполняем присваивание. Все прекрасно работало бы 
и без пу, а опытный программист на Ре! все равно сразу заметил бы, что мы 
использовали один символ = вместо двух ==. (Малоопытного программиста на 
Реп это могло бы ввести в заблуждение. Программисты на Разса] любого уров- 
ня мастерства будут в ярости.) 


Переходя к инструкции рг1п({, можно заметить, что используется форма двой 
ных кавычек 00(). Это дает возможность вставить обычные двойные кавычки 
и символ перевода строки. Мы могли бы интерполировать переменную $їпр, 
поскольку это, по существу, строка в двойных кавычках, но мы предпочли 
дальнейшую интерполяцию через ргігїї. Наша временная переменная ${пр те- 
перь вполне удобна, особенно учитывая, что мы ее не просто интерполируем, 
но также используем в условии оператора ?:, чтобы выяснить нужно ли ис- 
пользовать слово «те» во множественном числе. Наконец, обратите внима- 
ние, что мы выровняли два поля по соответствующим им маркерам % в строке 
формата ргіпїғ. Если аргумент слишком длинный, следующий аргумент мож- 
но перенести на другую строку, чего нам в этом случае делать не пришлось. 


Уф! Достаточно? Есть много других идиом, которые мы могли бы обсудить, но эта 
книга и так уже достаточно увесиста. Тем не менее мы хотим поговорить еще об 
одном идиоматическом использовании Ре!] – создании генераторов программ. 


Генераторы программ 


Как только люди обнаружили, что могут писать программы, они стали писать 
программы, которые пишут другие программы. Мы часто называем их генерато 
рами программ. (Любители истории, возможно, знают, что аббревиатура ВРС оз- 
начала Берогі Ргойгат Сепегафог (генератор программ-отчетов) задолго до того, 
как стала означать Вое Р1ауіпе Саше — «ролевая игра».) В наше время их, воз- 
можно, назвали бы «фабриками программ», но приверженцы генераторов добра- 
лись до них первыми и потому дали им название. 


Каждый, кому доводилось писать генератор программ, знает, что от него можно 
получить косоглазие, даже если быть настороже. Проблема проста: значительная 
часть данных программы выглядит как настоящий код, но им не является (по 
крайней мере, до поры до времени). Один текстовый файл содержит и фрагменты, 
которые что-то делают, и очень похожие фрагменты, которые ничего не делают. 
Реғ1 предлагает разные способы облегчить компоновку исходного кода Ре! с ис- 
ходным кодом на других языках. 


Генераторы программ 681 


(Конечно, эти возможности облегчают написание Рец на Реті, но, нужно думать, 
сейчас это и без пояснений должно быть ясно.) 


Генерирование других языков на Регі 


Рен (помимо прочего) – это язык обработки текста, а большинство языков про- 
граммирования являются текстовыми. Кроме того, отсутствие в Ре! произволь- 
ных ограничений в совокупности с различными механизмами расстановки кавы- 
чек и интерполяции облегчают зрительную изоляцию кода другого языка, кото- 
рый вы формируете. Вот, например, небольшой фрагмент $2р, транслятора ѕей-в- 
регі: 


ргіпт &9(<<"ЕОТ"); 
#1 $61п/рег1 
е\а1 `ехес $61п/рег1 -$ \$0 \%{1+"\$@" }' 
і? \$гиппіпо_опдег_ѕоте_ѕће11; 


ЕОТ 
Здесь вложенный текст оказывается законным в обоих языках, Рей и ѕћ. Мы сра- 
зу использовали идиому, которая поможет вам не потерять разум при написании 
генератора программ: прием с помещением символа «шума» и табуляции в нача- 
ле каждой цитируемой строки, что зрительно отделяет вложенный код, и благо- 
даря чему с первого взгляда можно сказать, что это не тот код, который в действи- 
тельности выполняется. Одна переменная, $0іп, интерполируется в многостроч- 


ную цитату в двух местах, а затем строка передается в функцию, которая отделит 
двоеточие и табуляцию. 


Конечно, не обязательно использовать многострочные цитаты. Часто можно уви- 
деть сценарии ССІ, содержащие миллионы команд ргіпї, по одной в каждой стро- 
ке. Примерно как приехать в церковь на болиде Формулы 1, но каждому свое... 
(Мы готовы допустить, что колонка инструкций рг171 обладает своей зрительной 
выразительностью.) 


При встраивании большой многострочной цитаты на каком-нибудь другом языке 
(например, НТМІ) часто удобно сделать вид, что вы программируете наоборот, 
включая Ре! в другой язык, как это можно сделать в откровенно вывернутых на- 
изнанку языках, таких как РНР: 


ргіпі <<“ХМЕ"; 
<510ҒҒ> 
<попѕепѕе> 
б1аһ Бан БЈаһ @{[ эса]аг ЕХРА ]} Ю1аһ Баһ б1аһ 
Лай БЛаһ б1аһ @{[ 115Т ]} біаһ о1аһ бЈаһ 
</попѕепѕе> 
</51иЁҒ> 

ХМ. 


Вы можете прибегнуть к любому из этих двух приемов для интерполяции выра- 
жений произвольной сложности в длинную строку. 


Некоторые генераторы программ не очень похожи на генераторы программ, в зг- 
висимости от того, какую часть своей работы они скрывают от вас. В главе 19 
«СРАМ» мы видели, как можно использовать маленькую программу Маѓеѓіе.РІ, 
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для создания Майейе. Размер МаЁе]1е легко может оказаться в 100 раз больше, 
чем породившая его МаЁейе.РГ.. Подумайте, от какой муки это избавило ваши 
пальцы. Или не думайте об этом - в этом, в конце концов, и заключается смысл. 


Генерирование Реп в других языках 


Ре! позволяет легко генерировать программы на других языках, но верно и об- 
ратное. Код на Ре] можно легко генерировать из других языков, потому что он 
лаконичный и гибкий. Можно выбрать свои кавычки, чтобы они не мешали ме- 
ханизму цитирования другого языка. Не надо беспокоиться об отступах или 
о том, где поместить переносы строки, или об обратной косой черте перед обрат- 
ной косой чертой. Не обязательно заранее определять пакет как одну строку, по- 
тому что разрешается многократно входить в иространство имен своего пакета, 
как только потребуется выполнить еще код из этого пакета. 


Еще одна вещь, которая облегчает написание кода Рег] в других языках (включая 
Рег), — это директива #1те. Ре! умеет обрабатывать ее как специальную дирек- 
тиву, изменяющую его представление об имени текущего файла и номере строки. 
Это полезно в сообщениях об ошибках и предупреждениях, особенно для строк, 
обрабатываемых е\а1 (которая, если вдуматься, и есть код Рей, который пишет 
код Рей). Синтаксис этого механизма тот же, что используется препроцессором С: 
когда Рей встречает символ # и слово 1іпе, за которыми следуют число и имя фай- 
ла, он устанавливает значение __1Т\Е__ равным числу, а значение __РІПЕ__ равным 
имени файла! 


Вот несколько примеров, которые можно проверить, непосредственно введя в регі. 
Для обозначения конца файла используется Сопіго!-Ю, что типично для ОМІХ. 
Пользователи рО$/Уіпдомѕ и УМЗ могут ввести Сопїго[-7. Если ваш интерпрета- 
тор команд обозначает конец файла другой комбинацией клавиш, используйте 
ее, чтобы сообщить ре] об окончании ввода. С другой стороны, всегда можно вве- 
сти __Е№О__, чтобы сообщить компилятору, что анализировать больше нечего. 


Здесь встроенная функция Рей магп выведет новые имя файла и номер строки: 


% рег1 
# пе 2000 “Одуззеу” 
# {Пе "в" оп {Пе ргеміоиѕ 1іпе тиѕї бе Тһе Ғігѕї сһаг оп 1іпе 
магп “роб бау 600г$”; # ог іе 
7р 
рой бау доогѕ аї Одуззеу 1іпе 2001 
А здесь исключительная ситуация, вызванная 01е в е\=1, попадет в переменную 


$0 (ФЕМАЕ_ЕНВОВ) вместе с новыми временными значениями имени файла и номера 
строки: 


# 1іпе 1996 О00уѕѕеу' 
ема] 99{ 
#1іпе 2025 "На1" 

91е “род бау 900г5”; 
}; 


1 Точнее говоря, он ищет шаблон /^#\3*11пе\5+(\0+)\5*(2:\5"([^" ]+)")?\5*$/, при этом в $1 со- 
храняется номер следующей строки, а в $2- необязательное имя файла в кавычках. 
(Пустое имя файла оставит значение __Е1.Е__ неизменным.) 
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ргіпі "Ргоб1ет міїћ $6”; 

магп “Т’т аҒгаіа Т сап`ф до їћаї”; 
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РгобТет міїћ роб бау доогѕ аї На1 1іпе 2025. 
Іп аѓгаіад І сап 'ї до їћаї аї 00уѕѕеу 1іпе 2001 


Здесь видно, что директива #1іпе действует только на текущую единицу компи- 
ляции (файл или еуа1 5ТАІМ) и после окончания компиляции этой единицы авто- 
матически восстанавливаются прежние установки. Благодаря этому можно орга- 
низовать собственные сообщения внутри е\уа1 5ТАТ или 00 ЕПЕ, не затрагивая 
оставшуюся часть программы. 


Одним из первых препроцессоров Рег! был транслятор ѕед-в-регі, з2р. Более то- 
го, Ларри отложил выпуск первой версии Рей, чтобы завершить работу над 32р 
и ашЕ-в-регі (а2р), поскольку полагал, что с ними Рей будет лучше принят. Ну, мо- 
жет быть, они и сыграли свою роль. 


Подробнее об этом сказано в электронной документации, а также в трансляторе 
Ппа2реч. 


Фильтры исходного кода 


Если можно написать программу для трансляции чего угодно в Регі, почему бы 
не дать возможность вызова этого транслятора из Регі? 


Понятие фильтра исходного кода возникло в связи с мыслью, что сценарий или 
модуль должны уметь расшифровывать себя на лету, например: 


#1 /иѕг/біп/рег1 
иѕе МубесгуртЕ1 тег; 
©*х$ ] `би№&К^7х02]2^Х{ . 231! (Е; 90/7А^@--8Н]| ‚07Р: д-= 


Но эта идея получила дальнейшее развитие, и теперь можно определить фильтр 
для любого преобразования исходного кода. Соединие это с действием ключа -х, 
о котором говорилось в главе 17, можно получить общий механизм, позволяю- 
щий загрузить любой программный фрагмент из сообщения и выполнить его, не 
зависимо от того, написан он на Ре! или нет. 


С помощью модуля НЦег из СРАМ“ сейчас можно делать даже такие вещи, как 
программировать на Ре! в аі: 


#1 /ивг/біп/рег1 
изе РіЈтег::ехес “а2р” # транслятор амк-в-рег1 
1.30 { ргіпЕ $1 } 


Это определенно можно отнести к разряду идиом. Но мы ни ь коей мере не будем 
утверждать, что это распространенный прием программирования. 
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Переносимость программ Рей 


Мир, в котором существует только одна операционная система, делает переноси- 
мость тривиальной, а жизнь скучной. Нам больше по душе обширный генофонд 
операционных систем, если только экосистема не разделяется однозначно на 
хищников и их добычу. Рег! работает на десятках операционных систем, и, по- 
скольку программы Реті не зависят от платформы, одна и та же программа без 
модификаций может выполняться на всех этих системах. 


Ну, это почти так. Рег] старается предоставить программисту как можно больше 
возможностей, но, если использовать особые функции конкретной операционной 
системы, это неизбежно ограничит переносимость программы на другие систе- 
мы. В этом разделе мы дадим некоторые указания относительно написания пере- 
носимого кода на Рей. Решив, до какой степени вам необходима переносимость, 
вы будете знать, где проходят границы, и сможете остаться в их пределах. 


Если взглянуть на это с другой стороны, написание переносимого кода обычно 
означает умышленное ограничение выбора. Естественно, это требует дисципли- 
ны и готовности к жертвам, двух качеств, обычно несвойственных программи- 
стам на Рег]. 


На странице регірогі справочного руководства перечислены платформы, более не 
поддерживаемые Реп. Среди них, например, Мас ОБ 9 (Сіаѕѕіс) и Міпдомѕ 95, 98, 
МЕ, МТ4. Они не просто не поддерживаются – из исходного кода языка Рег! был 
удален весь программный код, обеспечивавший их поддержку. Поэтому, в зави- 
симости от используемой версии Регі, может статься, что вы не сможете поддер- 
живать эти системы. Для поддерживаемых систем, обладающих характерными 
особенностями и отклонениями, созданы отдельные страницы в справочном ру- 
ководстве, перечисленные в табл. 22.1. 


Таблица 22.1. Страницы справочного руководства для отдельных систем 


Страница справочного руководства 


регіпеішаге регіѕутріап 


регіаіх регіўгеебѕӣ 


регіатіва рейвайи регіорепЬѕа региИгиб4 
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Страница справочного руководства 


рей феов реййрих регіоѕ2 регіиїѕ 
регіЬѕ2000 регіћһиға регіоѕ390 рейотеза 
рейсе регіігіх регіоѕ400 рейотз 
регісувиіп реййпих регіріап9 регіюоѕ 
рейавих рейтасоз регідпх реғішіп52 
регіаоѕ регітасоѕх регігівсоѕ 


регіерос регітреіх регізоіагіѕ 


Имейте в виду, что не все программы на Ре! должны быть переносимы. Нет осно- 
ваний не использовать Рег| в качестве связующего кода для инструментов ОМХ 
или для создания прототипов приложений Масіпёоѕћ, или для управления реест- 
ром Міпӣоуѕ. Если есть смысл пожертвовать переносимостью, сделайте это.! В це- 
лом заметьте, что понятия І пользователя, «домашнего» (Һоте) каталога и да- 
же состояния регистрации существуют только на многопользовательских плат- 
формах.? 


Специальная переменная $0 сообщает, в какой операционной системе был ском- 
пилирован Регі. Она служит для ускорения кода, которому в противном слу- 
чае пришлось бы использовать (01719 для получения тех же данных через 
$Сопѓід{оѕпапе}. Даже если Сопѓід был загружен с другими целями, вы все же сэко- 
номите на издержках поиска в связанном хеше. Можно также использовать моду- 
ли беуе1::Аѕѕегї05 и рехе1::Сһеск05 из СРАМ, предоставляющие дополнительные 
возможности. 


Более подробные сведения о платформе можно получить, просмотрев остальную 
часть хеша Сопѓ19, который предоставляется стандартным модулем Сопѓід. На- 
пример, чтобы проверить, поддерживает ли платформа вызов 15їаї, можно выяс- 
нить значение $Соп!19{9_1$1а{}. Полное описание имеющихся переменных можно 
найти в электронной документации по Соп{!10, а описание поведения встроенных 
функций Ре! на различных платформах можно найти на странице руководства 
регірогі. Вот функции Рей, действие которых больше всего зависит от платфор- 
мы (подробности смотрите в странице регірог?): 


-Х (проверка файлов), ассерї, а1а"т, біпа, біптоае, стой, спомп, спгоої, соппесї, сгурт, 
96тс10озе, дбтореп, йитр, епддгепі, епапоѕтепт, епдпетепт, епдргоїоепї, епірмепї, епаѕегуепї, 
ехес, їспї1, Ғі1Іепо, Т1осК, ҒогК, детдгепї, деїтогоіа, оетогпат, деіћоѕїруадаг, деїћозїрупапе, 
детһоѕтепї, деї109іп, деїпетруадаг, деіпеїрупапте, детпетепт, деїреегпате, деїрогр, деїрріа, 
деїргіогіту, деіргоїорупапе, детрготорупитбег, деїрготоепї, деїрмепї, деїрипап, деїрмиіа, 
детзегурурогт, детзегуепт, деїѕегурупапе, деїѕоскпапе, деёѕоскорї, 9100, іосї1, Кі11, 1іпк, 
11і5їеп, 151аї, тѕ9с+1, тѕодеї, пѕогсу, тѕоѕпа, ореп, ріре, ах, геаб1іпк, геааріре, гесу, ѕе1есї, 


Не всякий разговор обязательно корректен в любой культуре. Рег! старается дать хотя 
бы один способ сделать Все Правильно, но не пытается навязать вам это. В этом отно- 
шении Ре! более напоминает ваш родной язык (язык вашей матери), а не язык вашей 
няни. 


Впрочем, понятие «пользователь» в последнее время стало более расплывчатым, пото- 
му что даже системы, предназначенные для работы с одним человеком, могут иметь 
несколько «пользователей». 
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ѕетсї1, зетдет, зетор, зепд, зетпозтепф, ѕеїдгепї, зетпетепф, ѕеїрогр, ѕеїргіогітсу. 
зетрготоепт, ѕеїрмепї, зетзегмепт, ѕеёѕоскорї, зптст1, зитдет, ѕһтгеаа, зпимг1е, ѕЅћоиаомп, 
ѕоскеї, ѕоскеїраіг, ѕќаї, ѕут1іпк, ѕуѕса11, ѕуѕореп, ѕуѕїеп, {1тез, Египсате, итазк, итіте, 
маії, маітріа 


Перевод строки 


В большинстве операционных систем строки фаѓлов завершаются одним или 
двумя символами, уведомляющими о конце строки. Символы эти различны в раз- 
ных системах. ОМХ традиционно использует \012 (т. е. восьмеричный АЗСП-код 
этого символа равен 12), в системах, ведущих родословную от РОБ, используется 
последовательность \015\012, а старые Маки использую" \015. В Рей для представ- 
ления «логического» перевода строки, независимо от платформы, служит \п. 
В Рей для РОЗ \п обычно означает \012, но при обращении к файлу в «текстовом 
режиме» он транслируется в значение \015\012 или из него, в зависимости от того, 
читается файл или записывается. ОМІХ делает то же самое на терминалах в ка- 
ноническом режиме. Обычно \015\012 обозначается как СВГЕ. 


Поскольку рОЅ различает текстовые и двоичные файлы, реализации Рег для 
005 имеют ограничения при использовании ѕеек и їе11 с файлами в «текстовом 
режиме». Для получения оптимальных результатов выполняйте зеек только по 
позициям, получаемым от {е11. Однако в случае применения встроенной функ- 
ции Рег] біппойе с дескрипторами файлов, как правило, от вызовов еек и {е11 ни- 
какого вреда не случается. 


Распространенным заблуждением при программировании сокетов является мне- 
ние, что \п всюду означает \012. Во многих протоколах Интернета определены зна- 
чения \012 и \015, а значения Рег! \п и \г ненадежны, так как зависят от операци- 
онной системы, где выполняется код: 


ргіпЕ ЗОСКЕТ "Ні һеге, с1іепё* \015\012”; # правильно 
рг1пЕ ЅОСКЕТ "Ні 1һеге, с1іепї' \г\п"; # неправильно 


Однако использование \015\012 (или \СМ\сЈ, или \х00\х0А, или даже \13.10) может 
быть утомительным и портить внешний вид кода, а также смущать тех, кто зани- 
мается его сопровождением. Модуль Ѕ0скеї предоставляет кое-какие Правильные 
Вещи (для тех, кому они нужны): 


изе Ѕоскеї дм( : ЕҒАШІТ :сг1#); 
ргіпЕ ЅОСКЕТ "Ні һеге, с1іеп! САІЕ" # правильно 


При чтении из сокета помните, что по умолчанию значением разделителя запи- 
сей $/ является \п, а это значит, что придется проделать дополнительную работу, 
если вы не уверены в том, что будете наблюдать в сокете. Надежный код, выпол- 
няющий операции над сокетом, должен распознавать в качестве конца строки 
как \012, так и \015\012: 


изе Ѕоскет ам( : РЕҒАШТ :сг1{); 
10са1 ($/) = Е; # не требуется. если $/ уже \012 


мћі1е (<50СКЕТ>) { 
5/ФСА?ФЕ/\п/; # заменить СЕ или СВІЕ логическим переводом строки 
} 
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Аналогично, код, возвращающий текстовые данные, — например, подпрограмма 
загрузки веб-страницы — часто должен производить трансляцию символов пере- 
вода строки. Обычно достаточно одной строки кода: 


$Чата =- з/\015?\012/\п/д; 
геїогп фаата; 


Старшинство байтов и ширина чисел 


Для хранения целых и вещественных чисел компьютеры используют различ- 
ные порядки следования байтов: прямой (Біс-епаіапз) и обратный (Ше-епаіапѕ) 
Кроме того, различается и разрядность чисел (32-разрядные и 64-разрядные чис- 
ла сегодня встречаются чаще всего). Обычно об этом не надо задумываться. Но 
если программа посылает двоичные данные через сетевое соединение или запи- 
сывает на диск, который должен читаться другим компьютером, могут потребо- 
ваться некоторые меры предосторожности. 


Конфликтующие порядки старшинства байтов могут превратить числа в полную 
мешанину. Если на архитектуре с обратным порядком следования байтов (напри- 
мер, Іпќе СРО) число хранится в памяти как 0х12345678 (десятичное 305419896), 
то на архитектуре с прямым порядком следования байтов (например, СРО Мою- 
го]а) оно будет прочитано как 0х78563412 (десятичное 2018915346). Чтобы избе- 
жать этой проблемы в сетевых соединениях (через сокеты), используйте для раск 
и ипраск форматы п и К, которые записывают числа џпѕідпей ѕћогї и 10п9 в порядке 
Ы5-еп ап (называемом также «сетевым» порядком) независимо от платформы. 


Выяснить порядок следования байтов на своей платформе можно, распаковав 
структуру данных, упакованную в родном для платформы формате, например: 


зау ипраск("ћ+”, раск(“з2”, 1, 2)); 
# `10002000` на, скажем, Тпфе1 х86 или А1рһа 21064 в режиме 11411е-епд1ап 
# `00100020° на, скажем, Мотого1а 68040 


Определить порядок можно при помощи любой из следующих инструкций: 


$15 Брід епдіап = џпраск(”ћ»”, раск(“з” 1)) =- /01/; 
$15 11ї11е епдіап = ипраск("ћ*", раск(”з”, 1)) =- /71/; 


Даже если две системы имеют одинаковый порядок следования байтов, пробле- 
мы могут все же возникать при передаче данных между 32-разрядными и 64-раз- 
рядными платформами. Единственное подходящее решение – избегать передачи 
и хранения чисел в двоичном виде. Передавайте и храните числа в текстовом ви- 
де или применяйте модули, такие как Бата: :рипрег и Ѕїогаб1е, которые сделают это 
за вас. В любом случае лучше использовать текстовые протоколы: они более на- 
дежны, проще в сопровождении и расширении, чем двоичные. 


Конечно, с появлением ХМІ, и Юникода определение текста становится более гиб- 
ким. Например, между двумя системами, на которых выполняется Рег! 5.6.0 (или 
более новая версия), можно передавать последовательность целых чисел, закоди- 
рованных как символы в (18 (Ре-разновидность ОТЕ-8). Если по обе стороны 


* Порядок следования байтов в машинном слове зависит от архитектуры, часто опреде- 


лен в системе через псевдопеременную ВУТЕ_ОВОЕН. — Прим. науч. ред. 
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соединения находятся 64-разрядные архитектуры, можно обмениваться 64-раз- 
рядными целыми числами. В противном случае вы ограничены 32-разрядными 
целыми. Используйте для передачи раск с шаблоном *, а для приема — ипраск 
с шаблоном (+ (см. главу 26). 


Файлы и файловые системы 


Компоненты пути к файлу разделяются в ОМІХ символом /, в \/ш9до\з – симво- 
лом \, а в старых версиях Мас ОБ – двоеточием (:). Некоторые системы не поддер- 
живают ни жесткие ссылки (1іпк), ни символические (ѕут1іпк, геад1іпк, 15їаї). Не- 
которые системы обращают внимание на регистр символов в именах, некоторые - 
нет, а какие-то обращают на это внимание при создании файлов, но не при их 
чтении. Разные системы могут поддерживать разные наборы символов. 


Ниже мы дадим несколько советов относительно создания переносимых про- 
грамм на языке Реп: 


® Модуль Ғі1е::Ваѕепапе — еще один «терпимый» к платформам модуль, постав- 
ляемый в связке с Рей], расщепляет имя файла на компоненты: базовое имя 
файла, полный путь к каталогу и расширение файла. 


иѕе Рі1е: :Вазепате; 


пу $пате = Базепате( $АВСМ[0] ): 
ту $091г = дігпате( ФАВСМ[О) ); 


ту( Фбаѕе, $0іг, $зиЕР1х ) = #:1ерагѕе( $ААОУ[0], аг/\.[^ 1+\2/ ) 


• Стандартные модули Ғі1е::5рес предоставляют некоторые функции для нави- 
гации по файловой системе и объединения компонентов путей к файлам. Не 
определяйте пути к файлам, но конструируйте их: 


иузе Ее: :5рес: : Ғипсііопѕ; 
спд1г( иран () ); # переместиться вверх на один каталог 
фт11е = саїғі1е( сигдіг(), “етр“, “Ре. хе”); 


Последняя строка осуществляет чтение из ./етр/Ше4хе в ОМъМІХ и УПпаомз 
или из [4етр/ИелхЕ в УМ и запоминает содержимое файла в $Г11е. 


• Используйте модуль Ғі1е::Нотеріг из СРАМ, который находит специальные до- 
машние каталоги пользователей, определяя тип операционной системы и ав- 
томатически конструируя правильный путь. 


• Используйте модуль Раїћ::С1а55 из СРАМ, который предоставляет объектно- 
ориентированный интерфейс к модулям Ғі]е::5рес, упрощая чтение путей 
в формате одной операционной системы и их преобразование в эквивалентные 
пути в другой системе. 


• Используйте модуль Ғі1е:Лепр, входящий в состав Регі, который позволяет 
создавать временные файлы или файлы с именами, которые до сих пор не ис- 
пользовались. 

• Избегайте файлов с именами из одинаковых букв в различных регистрах, на- 


пример ѓеѕі.рі и Тезі.рі, поскольку некоторые платформы игнорируют регистр 
символов. Некоторые игнорируют, но сохраняют. 
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® По возможности соблюдайте в именах файлов соглашение 8.3 (восьмибуквен- 
ные имена и трехбуквенные расширения). Часто можно справиться с более 
длинными именами, если обеспечить их уникальность при протаскивании че- 
рез отверстие размером 8.3. (Это должно быть, легче, чем протащить верблюда 
через игольное ушко.) 


• Старайтесь, чтобы в именах файлов было как можнс меньше символов, не яв- 
ляющихся буквенно-цифровыми. Символы подчеркивания часто разрешены, 
но при этом теряется символ, который помог бы обеспечите уникальность 
в системах 8.3. (Помните, что по этой причине мы обычно не включаем симво- 
лы подчеркивания в имена модулей.) 


• Нормализуйте имена своих файлов или старайтесь не использовать не-АЗСИ 
символы. Поддержка Юникода в именах файлов в разных системах находится 
на разных уровнях, и отсутствует обобщенный АРІ, который одинаково дей- 
ствовал бы во всех системах. Некоторые символы могут быть допустимы в од- 
них системах, но вызывать ошибку в других. 


• Аналогично, применяя модуль Аџі05р11ї, постарайтесь ограничить имена под- 
программ восемью или менее символами и не давайте двум подпрограммам 
имена из одинаковых букв в разных регистрах. Если требуются более длинные 
имена подпрограмм, сделайте уникальными первые восемь символов каждого 
имени. 


• Всегда явно указывайте символ < при открытии файла для чтения, иначе в сис- 
темах, допускающих в именах файлов символь пунктуации, открытие файла, 
имени которого предшествует символ >, может привести к удалению файла, 
а открытие файла, имени которого предшествует символ |, может привести 
к открытию канала. Это вызвано тем, что формат ореп с двумя аргументами 
является волшебным и интерпретируеч гакие символы, как >, <и |, что может 
быть неправильным. (За исключением тех случаев, когда это правильно.) 


ореп(ЕТЕЕ, $ех1$11п9_111е) || діе $!, # неверно 
ореп(ЕТЕЕ, "<$ехіѕїіпо _Ғі1е”) || діе $!; # правильнее 
ореп(ЕТЬЕ. “<”, Фехіѕііпо_Рі1е) || 91е $! # еше правильнее 


» Выберите кодировку символов для операций ввода/вывода и укажите ее в до- 
кументации. А лучше дайте пользователям возможность самим выбирать ко- 
дировку. Если вы не знаете, чего хотите, используйте ОТЕ-8. Избегайте коди- 
ровки ОТЕ-16, которая может создавать проблемы, связанные с порядком сле- 
дования байтов. 


• Не следует предполагать, что текстовые файлы заканчиваются символом пе- 
ревода строки. Так должно быть, но иногда об этом забывают, особенно если 
этому помогает текстовый редактор. 


Взаимодействие с системой 


Платформы, основанные на графическом интерфейсе пользователя, часто не под- 
держивают командную строку непосредственно, поэтому для обеспечения рабо- 
тоспособности программ, требующих интерфейса командной строки, необходимо 
предпринять дополнительные птаги. 


Некоторые другие советы: 
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• На некоторых платформах нельзя удалять или переименовывать файлы, на- 
ходящиеся в работе, поэтому не забывайте закрывать файлы по завершении 
работы с һими. Не уничтожайте и не переименовывайте открытый файл. Не 
выполняйте їіе или ореп с уже связанным или открытым файлом; сначала вы- 
полните для него ип 1е или с105е. 


• Неоткрывайте файл на запись более одного раза одновременно, поскольку не- 
которые операционные системы в обязательном порядке блокируют файлы, 
открытые для записи. 


• Не полагайтесь на существование в %Е№\ конкретной переменной среды и не 
считайте, что данные в ЕМ чувствительны к регистру или сохраняют регистр. 
Не рассчитывайте на наследование семантики ОМХ для переменных среды; 
в некоторых системах они могут быть видимы для всех других процессов. 


• Не используйте сигналы или %51С. 


• Старайтесь избегать поиска имен файлов по шаблону. Вместо этого применяй- 
те орепбіг, геада1г и с10ѕебіг. (В Ре] версии 5.6 базовый поиск имен файлов по 
шаблону стал значительно более переносимым, но некоторые системы все рав- 
но могут приходить в раздражение от «юниксизмов» интерфейса по умолча- 
нию, если вы попытаетесь соригинальничать.) 


• Не полагайтесь на конкретные номера ошибок или строки, хранящиеся в $!. 


Межпроцессные взаимодействия (1РС) 


Чтобы повысить переносимость, старайтесь не запускать новые процессы. Это оз- 
начает, что нужно избегачь зузТет, ехес, Рогк, ріре, ``, ах// и орепс |. 


Основную проблему представляют не сами операторы; команды, запускающие 
внешние процессы, обычно поддерживаются большинством платформ (хотя неко- 
торые платформы не поддерживают ветвление ни в каком виде). Проблемы, скорее 
могут возникнуть при вызовах внешних программ, для которых семантика имен, 
адресов, вывода или аргументов может отличаться от платформы к платформе. 


Очень популярно использование кода Ре! для открытия канала в зепатай, что- 
бы программы могли отправлять электронную почту: 
ореп(МАТЕ, “| /иѕг/11р/ѕепдтаі1 -т”) || 91е "саппої РогК ѕепотаії $!7; 


Этот код не будет работать на платформах, где нет зепдтай. Чтобы создать пере- 
носимое решение, используйте для отправки почты модули из СРАМ, такие как 
Маі1::Маі1ег и Ма11::5епо в дистрибутиве Ма!Тоо|$ или Ма11::5епдта11. 


Функции ОМХ Ѕуѕќет У ІРС (п50*(), зет*(), ѕһт()) не всегда доступны даже на 
платформах ОМХ. 


В решении некоторых проблем с внешними командами на разных платформах 
могут помочь модули ТРС::Вип, ТРС: :буз{ет: :$ітр1е и Саріиге: Тіпу из СРАМ. 


Внешние подпрограммы (Х5) 


Код Х$ обычно можно заставить выполняться на любой платформе, но библиоте- 
ки и файлы заголовков могут оказаться недоступными либо сам код ХЅ может 
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оказаться специфическим для платформы. Если библиотеки и заголовки перено- 
симы, разумно предположить, что и код Х$ тоже можно сделать переносимым. 


При написании кода Х$ возникает проблема переносимости другого рода: нали- 
чие компилятора С на платформе конечного пользователя. Язык С привносит свои 
собственные проблемы переносимости, и написание кода ХБ знакомит вас с неко- 
торыми из них. Если писать только на Рей, переносимости добиться легче, потому 
что процесс конфигурирования Ре! изо всех сил старается скрыть от пользовате- 
ля недостатки переносимости С.! 


Станда ртные модули 


В целом стандартные модули (модули, увязанные с Рег) работают на всех плат- 
формах. Исключение составляют модули СРАМ.рп (в настоящее время он устанав- 
ливает соединения с внешними программами, которых может не быть), специфи- 
ческие для платформ модули (например, Ехїуїі15::ММ_ УМ) и модули ОВМ. 


Не существует единого модуля ОВМ для всех платформ. 50ВМ_Е11е и прочие обыч- 
но доступны во всех версиях для ОМІХ и рО. 


Хорошо, что в любом случае хотя бы один модуль ОВМ будет доступен, и Апу0ВМ_ 
Ее будет использовать тот модуль, который сможет найти. При такой неопреде- 
леһности следует применять только те функции, которые есть во всех реализаци- 
ях ОВМ. Например, ограничивайте свои записи размером в 1 Кбайт. Подробности 
можно найти в документации к модулю Апу0ВМ_Рі1е. 


Чуть лучше дело обстоит с базой данных 59114ќе, поддержка которой обеспечива- 
ет драйвер 0В0::501іїе для ОВТ. Это минималистичная и встраиваемая реляцион- 
ная база данных, находящаяся в открытом доступе (благодаря чему ее можно 
распространять вместе со своим программным кодом). Она может использовать- 
ся в большинстве операционных систем. 


Дата и время 


По возможности используйте для представления дат формат 150-8601 ("ҮҮҮҮ-ММ- 
00"). Строки вида "1987-12-18" легко преобразуются в специфические для системы 
значения с помощью модуля типа Ба{е``2эг5е. Список значений, представляющих 
время и дату (например, возвращаемый встроенной функцией 1оса1їіпе), может 
быть преобразован в специфическое для системы представление с помощью 
Тіте::Госа1. 


Встроенная функция їіпе всегда возвращает число секунд с начала «эпохи», но 
операционные системы придерживаются различных мнений относительно ее на- 
чала. Во многих системах эпоха началась 1 января 1970 года в 00:00:00 ОТС, но 
в УМ она началась 17 ноября 1858 года в 00:00:00. Поэтому для переносимости 
времени может потребоваться вычислить смещение начала эпохи: 


Некоторые маргиналы запускают сценарий Ре] Сопѓісиге в качестве дешевого развле- 
чения. Известно даже, что устраиваются «СопНриге гасеѕ» между конкурирующими 
системами, на которых разыгрываются крупные суммы. Такая практика в настоящее 
время признана незаконной в большинстве цивилизованных стран. 
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гедиіге Тіте: :оса1, 
фогРзет = Тіпе: :Госа1: : 1тедт(0, 0, 0, 1, 0, 70); 


Значением $0ї?ѕеї в ОМХ и УИ шдо\з всегда будет 0, но в других системах это мо- 
жет быть некоторым ббльшим числом. $0115е1 можно затем складывать со значе- 
нием времени ОМІХ и получать величину, которая в любой системе должна быть 
одинаковой. 


Представлением времени суток и календарной даты в системе можно управ- 
лять самыми разными способами. Не рассчитывайте, что часовой пояс хранится 
в $Е№{Т2}. И даже если хранится, не рассчитывайте, что сможете через эту пере- 
менную управлять часовым поясом. 


Если вам необходима возможность точного управления датой и временем, ис- 
пользуйте модуль ПаѓєТіпе из СРАМ. 


Интернационализация 


Не делайте предположений относительно используемой кодировки или окруже- 
ния. Вы и все ваши знакомые можете использовать одни и тє же настройки, но, 
как только вы займетесь распространением своего продукта, вы наверняка столк- 
нетесь с большим их разнообразием. 


Используйте внутри программы Юникод. Включите поддержку преобразования 
в другие наборы символов и обратно в интерфейсы своего кода. См. главу 6. 


За пределами мира Юникода следует делать как можно меньше допущений о на- 
борах символов и воздерживаться от допущений о порядковых значениях симво- 
лов. Не рассчитывайте, что символы алфавита имеют последовательные порядко- 
вые значения. Буквы в нижнем регистре могут идти как до, так и после букв вверх- 
нем регистре; нижний и верхний регистры могут чередоваться так, что оба симво- 
ла, аиА, будут предварять 0; акцентированные и прочие национальные символы 
могут чередоваться случайным образом. например г может предварять 0. 


Даже в мире Юникода следует помнить обо всех перечисленных особенностях. 
Существует масса алфавитных символов, порядок следования кодов которых ни- 
как не связан с их алфавитным порядком. 


Если ваша программа должна действовать в системе РОЅІХ (довольно смелое пред- 
положение), дополнительную информацию о национальных настройках РОЅІХ 
вы можете почерпнуть из страницы руководства регіїосаіе. Национальные уста- 
новки определяют, среди прочего, наборы символов и кодировки, а также форма- 
ты даты и времени. Правильное применение национальных установок сделает 
программу более переносимой или хотя бы более удобной и дружественной для 
пользователей, родным языком которых не является английский. Но помните, 
что национальные установки и ОМХ пока не очень хорошо сочетаются. 


Стиль 


Если в программе требуется иметь код, специфический для платформы, поста- 
райтесь локализовать этот код, чтобы облегчить перенос на другиє платформы. 
Для определения платформы воспользуйтесь модулем Сопѓід и специальной пере- 
менной $0. 
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Будьте внимательны с тестами, которые предоставляете вместе со своими модуля- 
ми и программами. Код модуля может быть полностью переносим, а вот тесты — 
нет. Это часто происходит, если тесты порождают другие процессы или вызывают 
внешние программы, которые должны содействовать тестированию, и когда (как 
было отмечено выше) тесты делают некоторые допущения относительно файловой 
системы и путей в ней. Следите, чтобы не было зависимости от определенного сти- 
ля вывода ошибок, даже при проверке в $! «стандартных» ошибок после системно- 
го вызова. Лучше использовать модуль Еггпо. 


Помните, что хороший стиль стоит вне времени и вне культуры, поэтому макси- 
мальной переносимости можно добиться, лишь отыскав универсальное в запро- 
сах, диктуемых суровой действительностью. Самые рассудительные люди не яв- 
ляются пленниками последних причуд моды; им это не нужно, потому что они, 
уважая собственную культуру (программистскую или любую другую), не стре- 
мятся быть в моде. Мода – это переменная, тогда как стиль – константа. 


Документация в формате РОБ 


Один из принципов, лежащих в основе архитектуры Рен, гласит, что простые ве- 
щи должны быть простыми, а сложные вещи должны быть возможными. Доку- 
ментация должна быть простой. 


Рей поддерживает простой формат разметки текста, называемый рой, который 
может использоваться самостоятельно или свободно смешиваться с исходным ко- 
дом, образуя встроенную документацию. Рой можно преобразовывать во многие 
другие форматы для печати или просмотра либо читать как есть. потому что это 
простой текстовый формат. 


Язык разметки рой не так выразителен, как ХМТ,, ИТЕХ, ѓгоѓ/(1) или даже НТМІ. 
Это сделано умышленно: мы пожертвовали выразительностью ради простоты 
и удобства. Некоторые языки разметки вынуждают автора набирать больше раз- 
метки, чем самого текста, что излишне осложняет работу и делает почти невоз- 
можным чтение. Хороший формат, как хорошая музыка к кинофильму, стано- 
вится фоном, который не отвлекает внимание. 


Заставить программистов писать документацию почти так же сложно, как заста- 
вить их носить галстук. Формат ро задумывался таким простым, чтобы даже 
программист мог (и стал) на нем писать. Мы не утверждаем, что формата рой дос- 
таточно, чтобы написать книгу, хотя для написания этой книги его хватило. 


Вкратце о роа 


Болыпинство форматов документов требует, чтобы весь документ соответствовал 
формату. Роб более терпим: можно встраивать роб в файлы любого типа, полага- 
ясь на трансляторы рой в извлечении род. Некоторые файлы целиком набраны 
в формате род. Но в других файлах, особенно в программах и модулях Рец, фраг- 
менты рой могут быть разбросаны всюду, где автор счел необходимым. Регі просто 
пропускает текст рой при синтаксическом анализе файла перед его выполнением. 


Лексический анализатор Реп понимает, что нужно начать пропускать текст, ко- 
гда вместо инструкции обнаруживает строку, начинающуюся знаком равенства 
в паре с идентификатором, например: 
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=һеад1 Неге Тһеге Ве Род$! 


Этот, а также последующий текст, вплоть до строки, начинающейся с =сиї, будет 
игнорироваться. Так мы получаем возможность свободно смешивать исходный 
текст программы и документацию, например: 


=| {ет ѕпа221е 


Тһе ѕпаг21е() Ғипс+іоп мі11 беһауе іп їһе тоѕї ѕресїаси1аг 
огт ТВаф уои сап роѕѕір1у іпадіпе пої емеп ехсерїіпд 
сурегпетіс руготесһпісѕ. 


=сиї 


3и6 ѕпаг21е { 
ту Фага = ѕһіғї; 


=іїет га771е 
Тһе га271е() Ғипст1оп епаб1еѕ аџтоаідасї1с ер1ѕтето1оду депегаїіоп 
=СиЕ 


$46 га221е { 
ргіпі "Еріѕтето1їоду депега+іоп ип1тр1етепеей оп {11$ р1афФогт. \п" 
} 


Другие примеры можно найти в любом стандартном модуле Реп или в модуле из 
СРАМ - все они должны содержать документацию в формате род, и почти все дей- 
ствительно ее содержат, кроме тех, где ее нет. 


Поскольку разметка рой распознается и отбрасывается лексическим анализатором 
Ре], можно посредством подходящей директивы рой быстро закомментировать 
фрагмент кода произвольного размера. Используйте блок ро4 =їог, чтобы заком- 
ментировать один абзац, и пару =бедіп/=епа для более крупного участка. О синтак- 
сисе этих директив рой мы расскажем позже. Помните, однако, что в обоих случа- 
ях вы остаетесь в режиме род, пока не вернетесь в компилятор посредством =сиї. 


ргіпі “получил 1\п' 


=Ғог соттепфагу 

Этот абзац игнорируется всеми, кроме некоего 
мифического транслятора "“соттепёагу” После его конца вы 
все еще в режиме род, а не в режиме программы. 

ргіп “получил 2\п“; 

=сиЇ 


# ок, вот теперь действительно программа 
ргіпі “получил З\п”; 


=редіп сомтепе 


ргіпё получил 4\1 ; 
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все, что здесь, 
будет игнорироваться 
всеми 


ргіпі “получил 5\п”; 
=епа соттепї 
=сиё 


ргіпі “получил 6\п“; 


При этом выводится, что получены 1, Зи 6. Помните, что эти директивы рой нель- 
зя поместить в произвольное место. Их можно поместить толькс там, где анали- 
затор рассчитывает обнаружить новую инструкцию, а не просто в середину выра- 
жения или куда-либо еще. 


С точки зрения Регі, вся разметка роа отбрасывается, но с точки зрения трансля- 
торов роа отбрасывается как раз код. Трансляторы ро4 рассматривают остав- 
шийся текст как последовательность абзацев, разделенных пустыми строками. 


Абзацы бывают трех типов: буквальные абзацы (уегфа т рагартарһѕ), абзацы 
команд (соттапа рагазтар!5) и абзацы прозы (ргозе рагаргарћз). 


Буквальные абзацы 


Буквальные абзацы используются для буквального текста, который должен ото- 
бражаться как есть. Например, когда требуется включить в документацию фраг- 
менты кода. Буквальный абзац должен иметь отступ, т.е. начинаться с пробела 
или символа табуляции. Транслятор должен точно воспроизвести его, обычно мо- 
ноширинным шрифтом, а символы табуляции предполагаются на границах каж- 
дых восьми колонок. Специальных управляющих символов форматирования нет, 
поэтому нельзя делать выделение курсивом или полужирным шрифтом. Символ 
< означает литерал <, и только его. 


Абзацы команд 


Все директивы ро@ начинаются символом = и следующим за ним идентификато- 
ром. Далее может располагаться произвольный текст любого объема, с которым 
директива может поступать по своему усмотрению. Единственное требование за- 
ключается в том, что весь текст должен быть написан в один абзац. В настоящее 
время распознаются следующие директивы (иногда называемые командами рой): 


=епсодіпо 


По умолчанию трансляторы ро4 предполагают, что исходная разметка род со- 
стоит либо из символов АЗСП, либо из символов Гайп-1. С помощью этой ко- 
манды можно изменить кодировку, например, на ОТЕ-5;: 


=епсодіпо иғі8 


=һеаа1 
=һеаа2 


Директивы =һеай1, =һеай2, ... создают заголовки заданного уровня. Остальной 
текст абзаца рассматривается как описание заголовка. Они аналогичны заго- 
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ловкам разделов и подразделов .5Н и .55 в тап(7) или тегам <Н1>...</Н1> и <Н2>.. 
</Н2> в НТМЕ. На практике именно в такие конструкции трансляторы преоб- 
разуют эти директивы. 


=Си 


Директива =сиї указывает на конец фрагмента род. (Далее в документе может 


следовать другой фрагмент род, но он должен начинаться новой директивой 
ро4.) 


=род 


Директива =рой лишь указывает компилятору, что анализ кода должен быль 
отложен до следующей директивы =си{. Полезна для добавления в документ 
еще одного абзаца, если текст программы и разметка рой чередуются часто. 


=0\ег МИМВЕВ 
=Мет ЗУМВОЕ 
=раск 


Директива =оуєег начинает раздел, который должен интерпретироваться как 
список с элементами, образуемыми директивой =іїеп. Завершается список ди- 
рективой =раск. Число МИМВЕР (если оно указано) указывает программе форма- 
тирования, сколько пробелов поместить в отступ. Возможности некоторых 
программ форматирования недостаточно богаты, чтобы использовать эту под- 
сказку, а других, наоборот, слишком богаты, поскольку при работе с пропор- 
циональными шрифтами трудно выровнять все в одну линию лишь при помо- 
щи пробелов. (Обычно считается, что четыре пробела оставляют достаточно 
места для маркеров или чисел.) 


Фактический тип списка определяется параметром 5УМВ0! в каждом элементе. 
Вот пример маркированного списка: 


=оуег 4 

=іїет * 

Міїһгі1 агтог (кольчуга из мифрила) 
= ет * 

Е1\еп с1оак (эльфийский плащ) 


=раск 
А вот нумерованный список: 


=омег 4 
=ігет 1 
Рігзі, зреак "Ғгіепа” (скажи “друг” ). 
=іїеп 2. 
Зесопд. епїег Могіа (войди в Морию). 


=раск 
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А вот именованный список: 


=о\уег 4 

=ет агтог() 

Описание функции агтог() 
=іїет сһапі() 

Описание функции сһап+( ) 


=раск 


Можно создавать вложенные списки одинаковых или разных типов, но при 
этом нужно придерживаться некоторых основных правил: не используйте =іїеп 
вне блока =охег/=раск; укажите хотя бы одну директиву =Цеп в блоке =0уєг/=раск; 
и, вероятно, самое важное, сохраняйте единообразие типов элементов внутри 
данного списка. Чтобы создать маркированный список, используйте для каж- 
дого элемента директиву =іїет +; чтобы создать нумерованный список — дирек- 
тивы =іїеп 1., =іїеп 2. и т.д.; чтобы создать именованный список — директивы 
=Цет Ғоо, =Мет баг и т.д. Начав с маркеров или чисел, придерживайтесь их, 
потому что программам форматирования разрешено использовать первый 
встретившийся тип =іїеп для определения того, как форматировать список. 


Как и во всем, что имеет отношение к род, качество результата зависит от ка- 
чества транслятора. Одни трансляторы обращают внимание на конкретные 
числа (или буквы, или римские цифры), следующие за =іїеп, другие - нет. На- 
пример, текущая версия транслятора рода? т весьма бесцеремонна: она вы- 
резает целиком указатели последовательности, даже не пытаясь выяснить тип 
списка, а потом помещает весь список между тегами <01> и </01>, чтобы браузер 
мог вывести его как упорядоченный список в НТМГ.. Не следует считать такое 
поведение нормальным; возможно, оно будет со временем исправлено. 


=Гог ТНАМУЕАТОВ 
=редіп ТААМЗЕАТОВ 
=епа ТААМГАТОВ 


Директивы =Гог, =0е01п и =епд позволяют включать особые разделы, которые 
должны передаваться в неизменном виде, но лишь определенным программам 
форматирования. Программы, которые узнают в ТНАМЕАТОЙ свое имя или псев- 
доним, обращают внимание на эти директивы; другие полностью их игнори- 
руют. Директива =Гог указывает, что оставшаяся часть абзапа предназначена 
конкретному транслятору. 


=Ғог Һіт1 
<р> Тһіу 15 а <Ғ1аѕһ>гам</?1аѕһ> <ѕта11>НТМІ.</ѕпа11> рагадгарһ </р> 


Парные директивы =редіп и =епд действуют аналогично =ѓог, но принимают не 
один абзац, а весь текст, заключенный между соответствующими =редіпи =епа, 
интерпретируя его как предназначенный для конкретного транслятора. На- 
пример: 


=редіп Пт 


<6г>Елдиге 1.<1М@ $ВС=“Р1диге! рпд“><6г> 


Вкратце о рой 699 


=епд пт 
=редіп Техї 


7777 Нідиге 1 


=епа техї 


В числе значений ТЛАМ№5/ АТОН, которые обычно принимаются программами фор- 
матирования: гоѓ?, пап, ігоѓ?, пгоѓ?, 101, едп, 1афех, тех, һіт1 и їехї. Некоторые 
программы форматирования воспринимают их частично как синонимы. Ни 
один транслятор не воспринимает сотптепі — это просто обычное обозначение 
того, что должно игнорироваться всеми. Таково же предназначение любого не- 
распознанного слова. Во время написания этой книги авторы часто оставляли 
для себя пометки с помощью директивы =Тог 1аїег.! 


Обратите внимание, что =редіп и =епо могут быть вложенными, но только в том 
смысле, что самая внешняя пара заставляет рассматривать все вложенные 
секции как не-роӣ, даже если там содержатся другие директивы =иого. Это зна- 
чит, что, когда транслятор встретит =6е01п ѓоо, он будет либо игнорировать, 
либо обрабатывать все до соответствующей директивы =епі ѓоо. 


Поток текста 


Абзацы третьего типа -— это просто «поток» текста. То есть если абзац начинается 
не с пробельного символа или знака равенства, он считается простым абзацем — 
обычным текстом, набранным с минимальным количеством «украшательств». 
Перевод строки считается эквивалентом пробела. Основная работа по приданию 
абзацу должного внешнего вида возлагается на транслятор, поскольку у про- 
граммистов есть более важные дела. Предполагается, что трансляторы использу- 
ют некоторые распространенные эвристики (см. раздел «Трансляторы и модули 
ро@» далее в этой главе). 


Однако кое-что можно делать явным образом. Внутри обычных абзацев или дирек- 
тив заголовков/элементов списка (но не вбуквальных абзацах) можно использовать 
особые последовательности для настройки форматирования. Эти последовательно- 
сти всегда начинаются с одной заглавной буквы, за которой следует левая угловая 
скобка, и простираются до парной (не обязательно следующей) правой угловой 
скобки. В последовательностях могут содержаться другие последовательности. 


В род определены следующие последовательности: 
Г<ехь 


Текст, выводимый курсивом, предназначен для выделения названий книг, на- 
званий кораблей и ссылок на страницы руководства, например «регірод(1)». 


В действительности мы написали собственный транслятор род, использующий собст- 
венный подкласс класса Род: :РзеидоРод и преобразующий исходный текст в формате 
род в формат РосВоок. 
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В<ѓехі> 


Текст, выводимый полужирным шрифтом, используется преимущественно 
для ключей командной строки, а иногда для названий программ. 


С<?ехї> 


Буквальный код, возможно, форматированный моноширинным шрифтом, та- 
ким как Соџгіег. Не обязателен для простых элементов, которые транслятор 
должен распознать как код, но использовать его следует в любом случае. 


5<1ех?> 
Текст с неразрывными пробелами. Часто окружает другие последовательносги. 
[<пате> 
Перекрестная ссылка на имя: 
І<пате> 
Страница руководства. 
1<пате/тдепт> 
Элемент страницы руководства. 
(<пате/"зес”> 
Раздел в другой странице руководства. 
[</^5ес”> 
То же самое. 


Следующие пять последовательностей те же самые, чтс и выше, но выводить- 
ся будет только Тех, а данные о ссылке будут скрыты, как в НТМІ: 


[<ѓехі|пате> 
І<ғех+|пате/ідепї> 
І<ѓехіпате/"ѕес”> 
[<ех є "ѕес”> 
і<ғех+|/"ѕес"> 


тех не может содержать символы / и | и должен содержать < или > только 
парами. 


Е<раїһпате> 
Применяется для имен файлов. Обычно выводится так же, как І. 
Х<еп?гу> 


Элемент указателя. Как всегда, что делать решает транслятор. Спепификация 
формата род это не регламентирует. 


Е<еѕсаре> 
Именованный символ, аналогично еѕсаре-последовательностям НТМГ: 
Е‹1> 


Литерал < (не обязателен, кроме других внутренних последовательностей 
и после заглавной буквы). 


Е<97> 


Литерал > (не обязателен, кроме других внутренних последовательностей). 
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Е<$01> 
Литерал / (требуется только в !<>). 
Е<уетбаг> 
Литерал | (требуется только в [<>). 
Е<МММ> 
Е<ОХХХХХХХ> 
Символ с номером (т.е. с кодом) МММ или ОХХХХХХХ в Юникоде. 
Е<епїііїу> 
Некая нечисловая сущность НТМІ., например Е<Адгауе>. 
7<> 
Символ нулевой ширины. Удобно помещать перед последовательностями, ко- 


торые могут интерпретироваться неправильно. Например. если в обычной 
прозе требуется начать строку знаком равенства, можно написать так: 


2<>=сап уои ѕее 
или в строке с «Егот», чтобы почтовая программа не поставила впереди >: 


2<>Егот Неге оп оџ+. . 


Чаще всего, чтобы указать границы последовательностей рой, достаточно одной 
пары угловых скобок. Однако иногда требуется поместичъ < или > внутрь последо- 
вательности. (Особенно часто это происходит в последовательности (<>, приме- 
няемой для оформления фрагментов кода моноширинным шрифтом.) Как всегда 
в Регі, есть несколько способов сделать это. Один из них — представить закрываю- 
щую скобку последовательностью Е<ЕМТТТУ>: 


С<$а Е<11>=Е<ої> $0> 


В результате получится "Фа <=> $6". 


Более удобоваримый и, возможно, более простой способ — использование альтер- 
нативного набора ограничителей, который не требует езсаре-последовательно- 
стей для угловых скобок. Применение двойных угловых скобок (0<< $1 >>) до- 
пускается при условии, что непосредственно за открывающим ограничителем 
и непосредственно перед закрывающим ограничителем имеется пробельный сим- 
вол. Например, можно написать так: 


(<< фа <=> $ >> 


Количество повторяющихся угловых скобок может быть любым, лишь бы они бы- 
ли парными, а пробельный символ непосредственно следовал за последней < слева 
и непосредственно предшествовал первой > справа. Поэтому можно писать и так: 


(<<< $а <=> $6 >>> 
С<<<< фа <=> $0 >>>> 


В любом случае. текст $а <=> $6 будет форматирован моноширинным шрифтом. 


Лишние пробелы внутри с обеих сторон удаляются, поэтому, если вам нужны 
пробелы, оставьте их снаружи конструкции. Кроме того, два внутренних участка 
дополнительных пробелов не перекрываются, поэтому, если в начале текста, за- 
ключенного в ограничители, стоят двойные угловые скобки >>, они не восприни- 
маются как закрывающий разделитель: 
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Тһе С<< >> >> гот эй орегаїог 


Эта строка породит текст «Тће >> гів! зһіб орегафог.». 


Обратите внимание, что род-последовательности могут быть вложенными. То 
есть, можно написать "1Іће І‹<Ѕапіа МагЕ<іасиїте>а> 1еР{ рогі а1геаду”, чтобы полу- 
чить «Тһе баша Мапа 1её рогі а]геаӣу», или "В<іоисћ> 5<В<-1> І<їіте>> 1<ЕПе>", 
чтобы получить «оџсћ -ї Нте Ш», и это будет работать правильно. 


Трансляторы и модули роа 


Рен поставляется с несколькими трансляторами ро4, которые преобразуют доку- 
менты в формате рой (или содержащие фрагменты в формате род) в различные 
другие форматы. Все должны корректно обрабатывать ьосьмибитные кодировки 
символов. 


рой2іехі 


Преобразует разметку рой в текст. Обычно на выходе получается 7-разрядный 
текст АСП; 8-разрядный, если он был 8-разрядным на входе, а если использу- 
ются последовательности вида 1 Е<џасиїе>їћіеп (для Гаеп) или ЕЕ<аџт1>гепаії 
(для ЕагепаЙ), текст на выходе будет иметь кодировку 180-8859-1 (или ОТЕ-8). 


Если имеется файл с разметкой род, вот самый простой (но, возможно, не самый 
красивый) способ просмотреть только отформатированные фрагменты род: 


% род2техт Ғіле.рт | тоге 
Но напомним, что разметка род должна быть читаема и без форматирования. 


рой2тап 


Преобразует разметку роа в формат страницы руководства ОМІХ, пригод- 
ный для просмотра с помощью пго//(1) или вывода на печать после обработки 
ігор). Например: 


% род2тап Рі1е.рт | пгоЁЕ -тап | роге 
или 


$ род2тап Е11е.рт | ТгоРЕ -тап -Трѕ - > їтрраде.рѕ 
% дһоѕзТуіем їтрраде. рѕ 


и вывод на печать: 
% 1рг -Рроѕіѕсгірї їтрраде. рѕ 


рой2ті 
Преобразует разметку рой в НТМГ-документ, который можно просматривать 
в браузере (даже в пупх): 
% род2мап Е11е.рм | Его#Ғ -тап -Трз - > фтрраде. рз 
% 1упх 1трраде. Піт] 
роайюиех 


Преобразует разметку рой в формат “ТЕХ, который затем можно сверстать 
с помощью этого инструмента. 


Трансляторы для преобразования в другие форматы можно найти в СРАМ. 


Создание собственных инструментов для работы с роа 703 


Составляя документацию в формате род, следует держаться ближе к простому 
тексту, не злоупотребляя элементами разметки. Выбирать визуальное представ- 
ление текста должен уже транслятор. Это означает, что транслятор должен опре- 
делять, как создавать парные кавычки, как заполнять текстом и выравнивать 
абзацы, как подобрать более мелкий шрифт для слов, целиком написанных за- 
главными буквами, и т.д. Поскольку трансляторы предназначаются для обработ- 
ки документов Ре], в большинстве своем! они должны также распознавать сле- 
дующие элементы и выводить их надлежащим образом: 


®  ЕШЕНАМОВЕ 

• $5ѕсајаг 

• б(аггау 

® Ғипстіоп() 

• папраде(Зг) 

• Ѕопероду@ѕотер1асе.сот 
• Ер: //#оо.сот/ 


Ре! включает также несколько стандартных модулей для анализа и преобразо- 
вания род, в том числе Рос: :Снескег (и соответствующая ему утилита роасйесЁег) 
для проверки синтаксиса документов роа, Род::Е1п0 для поиска документор роа 
в деревьях каталогов и Рой::51пр1е для создания собственных утилит обработки 
род. Внутри дистрибутивов для СРАМ можно использовать модуль Тез{::Род для 
проверки формата документации, а также Теѕї: :Род::Соуегаде для проверки нали- 
чия описаний всех интерфейсов. 


Обратите внимание, что трансляторы род должны рассматривать только абзацы, 
начинающиеся директивой рой (это облегчает анализ), в то время как компиля- 
тор фактически умеет находить езсаре-последовательности рой даже в середине 
абзаца. Отсюда следует, что следующий секретный фрагмент ѕесгеї ѕіиѓ# будет 
игнорироваться и компилятором, и трансляторами: 


$а=3; 

=ѕесгеї ѕі0?Ғ 

магп "№еіћег РОБ пог СОВЕ! ? 
=сиї Баск 

ргіпі "до $а\п”; 


Вероятно, не следует полагаться на то, что эта директива магп всегда будет исклю- 
чаться из документации роа. Не все трансляторы роа хорошо ведут себя в этом 
отношении, да и компилятор в один прекрасный день может стать разборчивее. 


Создание собственных инструментов 
для работы сроа 


Формат род проектировался таким образом, чтобы в нем, прежде всего, было лег- 
ко писать. Бесплатное приложение к этому: простота ро дает возможность соз- 
давать простые средства для обработки этого формата. Чтобы найти директивы 


1 Если вы создаете транслятор род общего назначения, а не только для кода на Ре, кри- 
терии могут быть иными. 
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род, установите разделитель записей в режим абзацев (вероятно, с помощью клю- 
ча -00) и обращайте внимание только на абзацы, похожие на разметку роа. 


Вот, например, простая программа офо4, извлекающая общую структуру род- 
разметки: 


#1 /изг/61п/рег1 -100п 

# 01 род - ои11те род 

пехі ип1еѕѕ /^=һеас/; 

5/7=һеаа(\а)\8+/ " " х ($1 + 4 – 4)/е; 
ргіп $_, “\п”; 


Если применить ее к исходному тексту данной главы, можно получить нечто 
вроде: 


Документация в формате род 
Вкратце о род 
Буквальные абзацы 
Абзацы команд 
Поток текста 
Трансляторы и модули род 
Создание собственных инструментов для работы с род 
Ловушки род 
Документирование программ нг Рег1 


По правде сказать, приведенная программа не обращала внимания на то, были 
ли блоки рой корректными. Поскольку разметку рой можно смешивать с любым 
другим текстом, запуск средств общего назначения для поиска или анализа фай- 
ла целиком не всегда имеет смысл. Но это не проблема, учитывая, как легко соз- 
давать средства для работы с род. Вот инструмент, который отличает фрагмен- 
ты рой и выводит только их: 


#' /иѕг/біп/рег1 -00 
# саїроа - саї только род 
мне (<>) { 
14 (! $іпроа) { $1прод = /7=/; р 
1 ($1проб) { $іпрод = !/"=сиї/; ргіаї: } 
} соп1лие { 
И (ео?) { с1оѕе АВбУ: $іпроа = 


} 


Можно использовать эту программу с другой программой или модулем Рег], а за- 
тем перенаправить вывод через конвейер в другую программу. Например, если 
имеется программа 10—(1)! для подсчета строк, слов и символов, можно накормить 
ее выводом саёроа, чтобы при подсчете учитывались только фрагменты род: 


х сатрод Мумоди1е.рм | мс 


Есть масса ситуаций, в которых ро позволяет писать примитивные инструмен- 
ты, тривиально используя простой бесхитростный Рег]. Теперь у нас в качестве 
компонента есть саірой и можно создать еще один инструмент, который выводит 
только код с отступами: 


1 Ееможно найти в Рей Ро\ег Тоо!ѕ из каталога СРАМ (АНрз://шило.теасрап.ога/тгеазе/ 
рр!/). 


Создание собственных инструментов для работы с рос 705 


#1 /иѕг/ріп/рег1 -п00 
8 род1ії - вывести литеральные блоки с отступом из входных данных род 
реги ЇР /7\5/; 


Как это можно использовать? Например, можно реализовать проверки регі -шс 
для кода, находящегося в документе. Или создать разновидность &7ер(1)', кото- 
рая ищет только в примерах кода: 


%Х сафрод МуМоди1е. рт | род1ії | огер Ғипспате 


Такая философия инструментов и фильтроь, состоящих из взаимозаменяемых 
(и допускающих независимое тестирование) частей, представляет собой чрезвы- 
чайно простой и мощный подход к разработке повторно используемых программ- 
ных компонентов. Это разновидность лени, состоящая в том, чтобы находить ми- 
нимальные решения, позволяющие решать повседневные задачи, по крайней ме- 
ре некоторые. 


В других случаях, однако, это может оказаться контрпродуктивным. Иногда на- 
писание инструмента с нуля требует больше труда, иногда меньше. Для того, что 
было нами показано выше, собственное мастерство Регі в обработке текста делает 
целесообразным применение грубой силы. Но не всегда получается именно так. 
Развлекаясь с форматом рой, можно заметить, что егс директивы легко анализи- 
ровать, но последовательности иногда оказываютсн несколько неочевидными. 
Последовательности могут быть вложены в другие последовательности и исполь- 
зовать ограничители переменной длины, хотя некоторые, с позволения сказать, 
«недокорректные» трансляторы этого не поддерживают. 


Помогая нам избежать необходимости писать весь этот код для синтаксического 
разбора, лень подсказывает другое решение. Можно воспользоваться стандарт- 
ным модулем Рой: :51тр1е. Сей модуль особенно полезен для сложных задач, когда, 
например, действительно требуется анализировать внутренние участки абзацев, 
преобразовывать их в альтернативные выходные форматы и т.д. В сложных слу- 
чаях с этим модулем легче работать, поскольку в итоге приходится писать мень- 
ше кода. Удобство еще и в том, что хитрый синтаксический анализ оказывается 
уже проделанным. Несомненно, это тот же принцип, что и при использовании 
саіроӣ в конвейере. 


Для решения своих задач модуль Рой::5іпр1е использует довольно интересный под- 
ход. Это объектно-ориентированный модуль иного типа, чем большинство тех, что 
вы видели в этой книге. Его основная задача не в том, чтобы предоставить объек- 
ты для непосредственного использования, а в том, чтобы дать базовый класс, на 
основе которого можно строить другие классы. 


Вы создаете собственный класе, наследующий Рос: :51тр]е (или один из его интер- 
фейсов) и реализующий все методы, необходимые для синтаксического анализа 
разметки род. Подкласс должен переопределять соответствующие методы, чтобы 
помочь анализатору вывести все, что вам требуется. Чтобы изменить поведение 
анализатора в желаемую сторону, достаточно переопределить только часть мето- 
дов. Возможно, для начала лучше написать транслятор, делающий лишь шаг 
к желаемому. Ниже приводится подкласс Рой::5ітр1е: Техї, отыскивающий в до- 


1 Аеслиу вас нет 2тер, см. предыдущую сноску. 
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кументации фрагменты (<> и создающий концевые сноски для каждой ссылки. 
Вы должны знать внутреннее устройство базового классе, что является наруше- 
нием инкапсуляции, которое мы лишь демонстрируем, но не одобряем: 


у5е у5. 14; 


раскаде [оса]. .МуТех{ 0.01 { 
иѕе рагепї “Роа: :$ітр1е: :Техї” 
иѕе рата: :ритрег; 
ту @1іпкѕ; 


зир 11пкѕ { 
$ [0]->{"”. _РАСКАВЕ__} {1116$} //= [1; 
} 


зуб ѕїагі | { 
ту($зе1е, $11пк) =@, 
риѕћ $ѕе1ғ->1іпкѕ, $11пк->{10}[2]; 


ѕир епа і { 
пу($%5е1ғ) = @ ; 
ту Фсоип = @{$5е1т->1іпкѕ}; 
$5е1Ғ->{Тһіѕрага) .= "[" Фсошп+ . "1; 


вир епа _Росипепї { 
пу($56е1#) = ѕһіғт; 
мһі1е (ту(Фіпдех, $1ехї) = еасһ $561#->1іпкѕ) { 
$ѕе1?->{Тһіѕрага} .= 
"$іпдех һр: //рег1дос. рег1 . огд/$Техт. һіт1\п”; 
} 
фѕе1 Ғ->ет+ раг; 


} 
1; 


Можно даже написать собственную версию программы род ехё, загружающую 
файл и вызывающую подкласс транслятора, но это необязательно, потому что 
реғійос позволяет загружать альтернативные классы форматирования с помощью 
ключа -М: 


Х рег19ос -Міоса1: :МуТехї зоте_род.род 
Для следующего фрагмента документации рой: 


=роа 


Если у вас появится желание ознакомиться со спецификацией Рег1 род 
читайте документацию 14<><рег1роа> или 12<><рег1родбѕрес>. 


=сиї 


получится следующее: 


Создание собственных инструментов для работы с рой 707 


Если у вас появится желание ознакомиться со спецификацией Рег] роб, 
читайте документацию рег1роб[1] или рег1родзрес[2]. 


0 һр: //реглоос. регі. ого/рег1роа. піт 
1 һер: //рег1аос.рег1. ого/рег1родѕрес. һіт1 


Этот пример просто изменил порядок интерпретации транслятором специфика- 
ции род. Ниже приводится другой пример, реализующий форматирование бук- 
вальных абзацев с помощью Рег1::Тійу: 


џиѕе м5. 14 


раскаде іоса1: `МуТіду 0.01 { 
џѕе рагепт "Род: :Ѕітр1е: : техї` 
џѕе Рег1: :Тіду; 


ѕиб епа Мегба+іт { 
ту($5е1#) = 6; 
Рег1: :Тіду: :рег11іду( 


зоигсе => \ $е1ғ->{Тһіѕрага}, 
деѕііпа+іоп => \ му Фот, 
агду => [9м/-9пи/], 


5 

$ѕе1#->{1һ1ѕрага} = $оџт =- 8/7 / /дтг; 

зау { Ф5е1г->{оџёрит һр } ^", $5е1ғ->{Тһіѕрага}; 
геТигп; 


} 
1; 
Этот класс отформатирует такой код: 
=епсодіпод иЁ#8 
=рой 
Это обычный абзац. 


#1 /иѕг/о1п/рег2 

џѕе м5. 14; 

Гог (@АВСУ) { 
ѕтате $соипт = 0; 
ѕау Ф$соџпі++, " ", $ 


} 
Еще один обычный абзац 


=сиї 


следующим образом: 


1 Модуль Рег1: Тібу понимает множество различных параметров, позволяя вам организо 
вать форматирование по своему вкусу. 
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Это обычный абзац 


#1 /оѕг/ріп/рег1 

ие м5. 14; 

Тог (@АВОМ) { 
этате $со0пї = 0; 
зау $соипі++, ““, $ 


} 
Еще один обычный абзац. 


Используя такой подход, можно даже расширять формат рой. Например, если 
у вас появится желание добавить новую команду, это легко сделать (хотя и не ре: 
комендуется). Нужно лишь сообщить анализатору, что новая команда является 
допустимой. В следующем примере новая команда \<> транслирует свой текст 
в список кодов символов. Вместо & в список попадет значение (0+00Е9). Это дос- 
тигается установкой флага при входе в команду \/<>, чтобы в һапд1е_+ехї можно 
было узнать, что требуется сделать: 


иѕе у5.14; 

раскаде І оса1: : МуСодеРоіпі 0 01 { 
иѕе рагепї “Род: :$ітр1е: :Техі”; 
узе Бата: : Оитрег; 


50р пем { 
пу Фее1Е = ЅҺЇҒҮ, 
пу $пем = $5е1#->50РЕН: : пем; 
фпем->ассерї_содеѕ("У"); 
гефигп $пем; 


ѕиб Папд1е_Техт { 
ту($561Ғ, Фехї) = @ , 
$561#->{Тђ19рага} . = 
фѕе1#->{"".__РАСКАВЕ__} {іп М} 
? $фве1?->таке_содероіпіѕ($1ехї) 
* $техї; 


50б шаке содероіпїѕ { 
Ф [1] =- 8/(.)/ ѕргіпсе "(0+%04Х)', огд($1) /дег; 


ѕир эфаге_\ { 
пу($ѕе1ғ, $техї) = @ ; 
$ъе1Е->{"". _РАСКАбЕ__}{1п_\} 


Ш 
> 


} 
ѕир епа М { 
пу($ѕе1ғ, $техе) = @ ; 
фѕе1ғ->{"".__РАСКАСЕ__ } {іп У} = 0; 
} 


Ловушки род 709 


С поддержкой новой команды следующий фрагмент роа: 


=епсобіпо иЁғВ 
=род 
\<А> Ла гесһегсһе аи Тетрѕ регди 


=сиї 


превратится в: 


(0+00С0) 1а гесһегсһе ди +етрѕ регаџ 


Ловушки рода 


Формат рой весьма прост, но все же в некоторых местах можно допустить прома- 
хи, сбивающие с толку некоторые трансляторы: 


Крайне легко пропустить закрывающую угловую скобку. 
Крайне легко пропустить замыкающую директиву =раск. 


Просто легко случайно вставить пустую строку в середине длинной директи- 
вы =Гог соттепі. Попробуйте использовать вместо нее =редіп/=епо. 


Если допустить опечатку в одном из тегов в паре =редіп/=епод, будет «съедена» 
вся оставшаяся часть вашего файла (имеется в виду только разметка род). По- 
пробуйте вместо этого применить директиву =їог. 


Трансляторы рой требуют, чтобы абзацы разделялись абсолютно пустыми 
строками, т.е. двумя или более последовательными символами перевода стро- 
ки (\п). Если в строке есть пробелы или символы табуляции, она не считается 
пустой. В результате два или более абзаца рассматриваются как один. 


Понятие «ссылки» в рой не определено, и каждый транслятор сам решает, что 
с ней делать. (Тот, кто начинает подозревать, что в большинстве случаев ре- 
шение остается за трансляторами, прав.) Трансляторы часто добавляют слова 
вокруг ссылки [<>, поэтому "1<Го0(1)>" может, например, превратиться в «ће 
[оо(1) тапрабе». Поэтому не следует определять ссылки в виде "їһе 1<Гоо> 
папраде”, если требуется, чтобы оттранслированный документ осмысленно чи- 
тался, иначе может получиться «ће {ће /о0(1) тапраёе таправе». 


Если необходим полный контроль над текстом ссылки, используйте формат 
І<ѕһом {01$ Техі|Ғоо>. 


Стандартная программа ройсћескег проверяет синтаксис рой и выводит ошибки 
или предупреждения. Например, она обнаруживает неизвестные последователь- 
ности рой и предположительно пустые строки, содержащие пробельные симво- 
лы. Кроме того, рекомендуется пропустить документ ро4 через как минимум два 
различных транслятора ро4 и проверить результаты. Некоторые возникающие 
проблемы могут быть особенностями конкретных трансляторов, и вам решать, 
будете ли вы искать пути обхода этих особенностей. Ниже приводится небольшой 
фрагмент в формате рой, имеющий некоторые проблемы: 


=епсодіпо иТҒ8 


=рой 
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Это - О<ра, а> 
=ітет * Элемент списка 


=сиї 


Программа ройсћескег обнаружит здесь две ошибки и выведет предупреждение 
о пробеле, невидимом в пустой строке: 


Хх родспескег бгокеп. рой 

«кж ЕНВОВ: Џпкпомп іпёегіог-ѕедиепсе 0` аї 11пе 5 іп Ее бгокеп. рой 

«кк ЕАВОВ; =ітет міїһоиї ргеуіоџѕ =о\ег аї 1іпе 7 іп Ее Бгокеп. род 

*хх МАЯМІМС. 11пе сопёаіпіпо поїһіпо Биф мћіїеѕрасе іп рагадғарћ аі 11пе 8 
іп Ее ргокеп. род 

бгокеп. роб ћаѕ 2 род зуптах еггог$ 


[+*«« ЕВАОВ: Неизвестная последовательность 0’ в строке 5 файла Бгокеп. род 
++ ЕҢВОВ. =ітет без предшествующей =оуег в строке 7 файла бгокеп. рой 
*кх МАВМТЮС: строка абзаца, не содержащая ничего кроме пробела, в строке 8 
файла ргокеп. род 
бгокеп. род содержит 2 ошибки синтаксиса род. ] 


И, как всегда, Все Может Измениться по Прихоти Безымянного Кодоборца. 


Документирование программ Реп 


Мы надеемся, что читатель документирует свой код независимо от того, является 
ли он Безымянным Кодоборцем. Если это так, то, вероятно, вы захотите вклю- 
чить в документацию следующие разделы: 


=Веад1 МАМЕ 

Название программы или модуля. 
=Пеад1 5УМОР$ЗТ$ 

Аннотация назначения модуля. 
=Пеад1 БЕЗСАТРТТОМ 


«Простыня» документации. (В данном контексте «простыня» — хорошая прак- 
тика.) 


=Пеад1 АИТНОВ 

Кто вы такой. (Или ваш псевдоним, если вам стыдно за свою программу.) 
=һеаа1 ВОб$ 

Что вы делали неправильно (и почему на самом деле вы в этом не виноваты). 
=һеай1 ЕЕ АЁЗО 


Где можно найти дополнительную информацию (чтобы справиться с ошибка- 
ми в программе). 


=пеааїі СОРҮВІСНТ 


Уведомление об авторских правах. Если вь хотите явным образом заявить об 
авторских правах, можно сказать что-то вроде: 


Соругідһі 2013. Вапду Матегћоџѕе. А11 Відһіѕ Везегуед. 
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Во многих модулях также добавляется: 


Тһіѕ ргодгат 13 Ргее ѕоҒімагє. Үоџ пау сору ог 

гейіѕігірите ії ипдег +һе зате Тегтѕ аз Рег1 іїѕе!? 

[Эта программа распространяется свободно. Вы можете копировать 
или распространять ее на тех же условиях, что и Рег1] 


Одно предостережение: помещая документацию в конец файла и используя лек- 
семы __Е№0__ или _ РАТА, не забудьте вставить пустую строку перед первой ди- 
рективой род: 


__ЕЮВ__ 
=һеад1 МАМЕ 


Модегп - І ат їпе уегу тоде1 оѓ а тмодегп тајог тоди]е 


Если перед =Пеад1 не будет пустой строки, трансляторы ро4 не обнаружат вашу 
(обширную, точную и грамотную) документацию. 
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Культура Реп 


Эта книга является частью культуры Рец, и мы не можем надеяться, что в нее 
удастся вместить все, что мы знаем о культуре Ре]. Немного истории и немного 
искусства — кто-то сказал бы «очень немного искусства» — и некоторые факты из 
жизни сообщества позволят нам раздразнить ваш аппетит. Значительно больше 
о культуре Реп сказано на АНр://шшиш.ре1.огв. Или просто познакомьтесь с други- 
ми программистами на Регі. Мы не можем сказать, какого сорта люди вам попа- 
дутся: едва ли не единственная общая черта характера программистов на Ре] — 
это патологическая готовность прийти на помощь. 


История практичности 


Чтобы понять, почему Рег! получился именно таким (а не каким-то другим), при- 
дется сначала разобраться, почему Рей вообще появился на свет. Поэтому стрях- 
нем пыль с нашего старого учебника истории... 


Давным-давно, аж в 1986 году, Ларри работал системным программистом в про- 
екте по разработке глобальных сетей с многоуровневой защитой. Он отвечал за 
структуру, состоявшую из трех УАХ и трех Зип на западном побережье, соеди- 
ненных на скорости 1200 бод через зашифрованную последовательную линию 
с аналогичной конфигурацией на восточном побережье. Поскольку основной за- 
дачей Ларри была поддержка (в проекте он участвовал не как программист, а про- 
сто как системный гуру), он смог воспользоваться тремя своими добродетелями 
(ленью, нетерпеливостью и высокомерием), чтобы разработать и усовершенство- 
вать всевозможные полезные инструменты, например гп, раѓсћ и шагр.1 Однажды, 


1 Примерно в это время Ларри уловил смысл фразы «ѓееріпе сгеафбат1:т» (В «Новом сло- 
варе хакера» Эрика С. Реймонда чудесно сказано, что, во-первых, этот термин происхо- 
дит от «сгеершя Ѓеабигіѕтп», а во-вторых, «...четкого определения ... нет, но любой хакер 
поймет, о чем идет речь». — Прим. перев.) в отчаянной попытке оправдать, нє основа- 
нии биологической необходимости, свое непреодолимое стремление «добавить еще од- 
ну функцию». В конце концов, если Жизнь Попросту Слишком Сложна, почему то же 
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как раз когда Ларри разорвал гп в клочья и разбросал их по своему каталогу, до 
него снизошел великий Менеджер и произнес: «Ларри, нам нужна система управ- 
ления конфигурацией и контроля для всех шести УАХ и всех шести Бип. Через 
месяц. Займись ка этим» 


И Ларри, который никогда не уклонялся от работы, задал себе вопрос: как лучше 
всего сконструировать систему управления компьютерами на восточном и запад- 
ном побережьях, позволяющую видеть отчеты о проблемах, возникших в обоих 
местах, давать разрешения и осуществлять контроль, и при этом не писать все с ну- 
ля. Ответ пришел в виде одного слова: В-пеуѕ.! Ларри взялся за дело и установил на 
этих машинах программы работы с телеконференциями, добавив две команды 
управления: «аррепа», чтобы выполнять добавление к существующей статье, 
и «ѕупсһгопіғе», чтобы номера статей были одинаковыми на обоих побережьях. 
Управление компьютерами предполагалось осуществлять посредством системы 
управления версиями ВСВ (Кеуіѕіоп Сопіго! Зуѕіет), а подтверждения и новые за- 
просы выполнять посредством телеконференций и гп. Для начала очень хорошо. 


Затем великий Менеджер попросил представить ему отчеты. Сообщения храни- 
лись в отдельных файлах на главной машине, а файлы были связаны массой пе- 
рекрестных ссылок. Сначала Ларри подумал: «Используем аш». К несчастью, 
вто время ашЕ не справлялась с открытием и закрытием многих файлов на основе 
информации в этих файлах. Ларри не захотел писать инструментальное средство 
для решения специальной задачи. В результате появился новый язык. 


Этот новый инструмент изначально не назывался Рег]. Ларри обсуждал некото- 
рые названия с коллегами и помощниками — Дэном Фэйджином (рап Еаісіп), ав- 
тором этого повествования, и Марком Биггаром (МагК Вірраг), своим родственни- 
ком, который также очень помог ему в начальной разработке. Ларри рассмотрел 
и отверг все трех- и четырехбуквенные слова из словаря. На заре своего существо- 
вания Регі носил, в частности, название «Сота» в честь возлюбленной (и жены) 
Ларри. Но затем Ларри решил, что это вызовет ненужную путаницу в семье. 


Затем возникло название «Реагі», превратившееся в современное «Рег!» отчасти 
потому, что Ларри встретилось упоминание другого языка с названием РЕАКІ,, 
но главным образом потому, что Ларри слишком ленив, чтобы каждый раз наби- 
рать пять букв. И конечно, потому, что Рей подходил на роль слова из четырех 
букв?. (Однако следы прежнего написания можно обнаружить в толковании ак- 
ронима: «Ргасііса1 Ехігасііоп Апа Берогі Гапёиазе».3) 


Ранний Рей не обладал многими возможностями современного Рец. В нем уже 
были поиск по шаблону и дескрипторы файлов, скаляры и форматы, но было 
очень мало функций, довольно увечная реализация регулярных выражений, за- 


будет справедливо и для программ? Особенно для таких программ, как гл, которые 
следовало бы рассматривать как передовые проекты искусственного интеллекта, пото- 
му что они уже на грани того, чтобы зачитывать вам новости вслух. Правда, кое-кто 
скажет, что даже программа раѓсћ уже слишком заумна. 


То есть второй реализации транспортного программного обеспечения Озепеф. 


В английском языке идиома «Ёопг-еЦег могӣ» обозначает ругательства и бранные сло- 
ва, многие из которых в английском состоят как раз из четырех букв. – Прим. ред. 


з Иногда это называют обратной аббревиатурой (БасЕгопут), поскольку сначала появи- 
лось название, а потом его расшифровка. 
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имствованная из гл, и отсутствовали ассоциативные массивы. Объем руководст- 
ва составлял всего 15 страниц. Но Рей был быстрее, чем зе4 и арР, и стал исполь- 
зоваться в других приложениях проекта. 


Но Ларри был нужен везде. В один прекрасный день пришел другой великий Ме- 
неджер, который сказал: «Ларри, займись поддержкой исследовательских ра- 
бот». Ларри просто согласился. Он прихватил с собой Рег! и обнаружил, что язык 
превращается в хорошее средство системного администрирования. Он позаимст- 
вовал великолепный пакет регулярных выражений Генри Спенсера (Непгу Бреп- 
сег) и перекромсал его так, что Генри старался не думать об этом за едой. За- 
тем Ларри добавил кое-что для себя и кое-что для других. Он опубликовал Рег] 
в сети! Остальное, как говорят, уже история.? А развивается она примерно так. 
Рей 1.0 вышел 18 декабря 1987 года; некоторые до сих пор всерьез отмечают День 
Рождения Ре! в этот день. В июне 1988 последовал Рег] 2.0, и Рэндал Шварц 
(Капда! Ѕсһмагі2) создал свою легендарную подпись «Јиѕі Апоћег Рен Наскег» 
(ЈАРН). В 1989 году Том Кристиансен (Тот Сһгіѕііапѕеп) представил первый об- 
щедоступный учебник Ре! на ОЅЕМІХ в Балтиморе. Начиная с версии Рег! 3.0, 
вышедшей в октябре 1989, язык впервые стал распространяться на условиях 
СМО Раб {с ісепѕе. 


В марте 1990 Ларри пишет первое стихотворение — Рей Роеш (см. следующий раз- 
дел). Затем в соавторстве с Рэндалом первое издание этой книги — «Тһе Рик 
Саше] (розовый верблюд); она увидела свет в начале 1991 года. Одновременно по- 
явился Регі 4.0; распространявшийся уже на основе двух лицензий, ОРГ. и АгИз- 
бс Тасепее. После выхода Рег1 4 Ларри задумал создать улучшенную версию Рег; 
в 1994 году появилась группа Рег] 5 Рогіегѕ, или просто р5р, взвалившая на себя 
бремя переноса ре] практически на все платформы, до которых смогла дотянуть- 
ся. Состав этой группы постоянно меняется, но она до сих пор отвечает за разви- 
тие Рен и его поддержку. 


Презентация весьма ожидаемого Рег 5 прошла в октябре 1994. Рей переписали 
полностью, в нем появились объекты и модули. Пришествие Регі 5 даже удостои- 
лось освещения в «Тће Есопотіѕі». В 1995 сообщество Рей официально познако- 
мили с архивом СРАМ“. В 1996 Джон Орвант (Јоп Огжапі) начал издавать «Тће 
Ре] Зоигпа!. Осенью того же года после длительного вынашивания родилось 
второе издание этой книги, «Тһе Вше Сате]» (голубой верблюд). В 1997 группа 
известных Рег-активистов основала организацию «Тһе Ре! пище», занимаю- 
щуюся популяризацией и поддержкой Рег. 


1 Что еще более удивительно, Ларри продолжал выпускать новые версии, когда начал 
работать в Јеї Ргориіѕіоп ІБ, затем в Ме Т.аЪз и Ѕеараїе, а затем в О’КеШу & Аѕѕосіаёеѕ 
(это небольшая компания, издающая памфлеты о компьютерах и подобной дребедени; 
сегодня она называется О’ВеШу Медіа). 


2 Ираз так, даем историческую справку. Когда началась работа над Рец, гп как раз была 
разобрана «по кирпичику» для капитальной реконструкции. Начав работать над Регі, 
Ларри не прикоснулся к гп. Она по-прежнему разобрана на кусочки. Время от времени 
Ларри грозится переписать гп на Регі, но это он не всерьез. 


з И называлась «Ргобгаштшя регі», где слово «регі» было набрано строчными буквами. 


4 «В отличие от большинства свободно распространяемых программ, Рег не только ра- 
ботает, но и приносит пользу» — «Еесітіс теѓге», Тће Есопог1$, 1 июля 1995 года. 
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Летом 1997 года в Сан-Хосе, штат Калифорния, прошла первая конференция 
О’ВешУ по Ре «Тће Ре Сопѓегепсе» (ТРС). На этой конференции группа жите- 
лей Нью-Йорка организовала первую группу пользователей Регі, получившую 
название /№ем Үогк Рег1 М((о|и)пдег$|аптас$)*/. По соображениям удобства это на- 
звание позднее превратилось в МУ.рт и послужило образцом для большинства 
названий групп пользователей Рей, появившихся позднее. В следующем году, 
когда эта же группа помогла другим в создании собственных групп пользовате- 
лей, она превратилась во всемирную группу пользователей Рей (АНр://шиль. 
рт.ога) и приняла на себя обязанности группы «Тһе Ре! азИйте». 


В 1999 году Кевин Ленцо (Кеуіп Іеп2о) организовал конференцию «Үеі Апоёћег 
Рей Сопѓегепсе» (УАРС) в университете Карнеги-Меллона (Сагпегле МеНоп) в Питс- 
бурге. Технические конференции в основном проводились на западном побере- 
жье США, близ Кремниевой долины. Это доставляло неудобства жителям восточ- 
ного побережья. 


В этом же году Крис Нандор (Сһгіѕ Мапдог) написал на Рег! сценарий, отправив- 
ший 25000 поддельных голосов на голосовании за звезд бейсбола в пользу шорт- 
стопера (5Ногёфор) Номара Гарсиапарры (Мотаг Сагсіарагга), игрока команды 
«Возюп Кей Ѕох», заработав ему упоминание его имени в истории голосований 
на несколько последующих лет. Эта история может служить примером, какое 
влияние может оказать короткий эпизод в телевизионном шоу «Зрогіѕ №ф».?2 


В следующем году лондонская группа пользователей Реп организовала конферен- 
цию УАРС::Е 0 (которая, впрочем, была не первым крупным событием Реп в Ев- 
ропе; первая конференция «Сегтап Рег Могкѕһор» предшествовала даже конфе- 
ренции «Тһе Ре] Сопѓегепсе»). Эти конференции оказались настолько успешны- 
ми, что превратились в организацию «Үеё Апоћег ЕоипдаНоп» (также известную, 
как «Тһе Рей] Коипдайоп») в США и «ҮАРС Еџгоре Гоипдайоп» в Европе. Вскоре 
появились аналогичные конференции ҮАРС в Азии и Южной Америке, хотя из 
общего у них было только название. Теперь не проходит и недели без крупного со- 
бытия Ре! где-нибудь в мире, что еще больше сплачивает сообщества людей, кото- 
рые работают независимо друг от друга, но встречаются достаточно часто. 


Конференция «Тһе Рей Сопѓегепсе» продолжала расти в других направлениях. 
Она превратилась в конференцию «Тһе Ореп Боигсе Сопѓегепсе», или просто 
ОЗСОМ, где Ларри регулярно выступает со своей речью «ќаѓе оѓ ће Опіоп», а Да- 
миан Конвей (ЮОатіап Сопжау) вызывает восторги аудитории своей речью «Тһе 
Сопуау Сһалпе]». В 2000 году на конференции ОЗСОМ“ Ларри анонсировал Реп 6 — 
который не является темой этой книги - как амбициозный проект, начатый с ну- 
ля. В этой книге мы скажем лишь, что Рег] 6 в значительной степени является 
забавой, он оживил развитие Регі 5 и помимо названия «Рег» не имеет ничего об- 
щего с языком программирования, о котором мы здесь рассказываем. Это совер- 
шенно другой язык, заимствующий кое-что из Ре], как Рей заимствует из дру- 
гих языков. 


1  «Субег-вбаЁНие гетаіпѕ іһгеаї їо АП-Б{аг уойп&» (голосование за звезд оказалось 
под кибернетической угрозой), ЕЗРМ-сош (лёёр://ѕѓаѓіс.еѕрп.во.сот/ті/8/2001/0624; 
1218244.№ті). 


2 Вэпизоде «Гоше Кеуіѕібед», вышедшем 26 октября 1999, рассказывалось. как Джере- 
ми (Јегету) использовал сценарий на Рег! для отправки поддельных голосов за Кейси 
(Саѕеу), одного из телеведущих. 
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Продолжение истории, по крайней мере после 2002 года, см. в Рей Тітејіпе на 
СРАЅТ — Сотргеһепѕіуе Ре! Агсапа Ѕосіеу Тареѕігу (ћіір://ћіѕіогу.регі.ога). 


Поэзия Реп 


Ре предполагает, что любое встретившееся голове слово, в конечном счете ста- 
нет названием подпрограммы, даже если в данный момент подпрограмма не оп- 
ределена. Иногда такой стиль программирования называют «поэтическим». Это 
позволяет людям писать на языке Рег] стихи вроде вот такого монстра: 


ВЕҒОВЕНАМО: с10зе доог, еасп мзпаом & ехії; маії иптз1 т1те 
ореп ѕре116оок, зфиду, геад (ѕсап, ѕе1есі, 1е11 из); 
мгіге 11, ргіпї тһе һех мћі1е еасһ маїсһеѕ, 
геуегзе іїѕ Іепоїһ, "ге адаіп; 
кі11 ѕрідегѕ, рор їһет, спор, >р11ї, Кі11 #һћет. 
ип ик агтѕ, $ҺіҒЕ, маі & ііѕтеп (11ѕїепіпо, маії), 
зогЕ һе Ғ1оск (іһеп, магп Тһе "доаїѕ” & кі11 {Пе "ѕһеер”); 
К111 +һет, дитр диаітѕ, 5һіғЕ тога1111е5, 
уа1иеѕ аѕіде, еасһ опе; 
діе знеер' Піе їо геуегзе тие зузфет 
уои ассерї (гефест, геѕрес+); 
пехе зтер, 
К111 їһе пехї ѕасгіҒісе, еасћ засг11се, 
маії, гедо гіїџа1 ипїі] "а11 1һе ѕрігіїѕ аге р1еа$ед”; 
00 14 (“аз їћеу ѕау"). 
90 1т(*емегуопе»* ««тиѕ х »*рагЕ1с1рате»***1п***Гого100еп» *5*е*х*) 
гефигп 1аѕі уісїіт; раскаде Бобу; 
ех1ї сгурт (+іте, іітеѕ & “Па1Р а їіпе") & с10$е ії, 
ѕе1есї (диіск1у) & магп уоиг пехї уісїіпт; 
АРТЕВМОВО$: #е11 породу. 
маії, маії ипт11 Тіпе; 
маії ипф11 пехї уеаг, пехї десаде: 
ѕ1еер, з1еер, діе уоигѕе1?, 
01е аї 1а51 


Ларри написал это стихотворение и отправил в пеиз.8гоир$ в поддержку своего 
предложения создания группы сотр.Іапё.регі.роетз. Большинство, вероятно, за- 
метило, что стихотворение было отправлено 1 апреля, но это не удержало их от 
создания собственных стихов на Регі. 


Шэрон Хопкинс (Ѕћагоп Норкіпѕ) написала много стихотворений на Регі, а также 
статью о поэзии Регі, которую представила на технической конференции Оѕепіх 
зимой 1992 года, озаглавленную «Сате!з апа №еез: Сотриќег Роеігу Меефз {Ве 
Рен Ргосгашииия Гапецаее» (Иголки и верблюды: на стыке компьютерной по- 
эзии и языка программирования Рег). Шэрон не только самая плодовитая из по- 
этов на Рен, но и самая публикуемая; следующее ее стихотворение было опубли- 
ковано в «Тһе Есопотізі» (ћіёёр:/Лошо.есопотізі.сот) и «Тре Сиаг Пап» (В р://шило. 
зиагфаппеиз.сот): 


#1 /иѕг/ріп/рег1 


АРРЕАГ : 
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1іѕїеп (р1гаѕе, р1еазе); 


ореп уоигѕе1Ғ, міаде; 
јоіп (уои, пе), 
соппесї (иѕ, їодеїһег), 


те11 пе. 
до ѕотећіпо і? діѕїгеѕѕеа; 


©дамп, дапсе; 

б@еуепігод, $1п9; 

геад (оок, фроетѕ, зфоглез) ипіі1 реасеѓи1; 
зі0ду і? ар1е; 


мгіте пе 1ѓ-уои-ріеаѕе; 
ѕогі уоиг Ғее11пдѕ, гезеЕ доа15, ъеек (?гіепӣѕ, Ғаті1у, апуопе); 


до*по*діе (11ке #115) 
11 5іп абоипаѕ; 


кеуѕ (һіддеп), ореп (10скѕ, аоогѕ), 1е11 ѕесгеїѕ; 
до поё, Т-Беч-уои, с10$6е їћет, уеї. 


ассерї (уоцгзе1{Р, сһапоеѕ), 
ріпа (дгіеғ, деѕраіг); 


гедиіге Тгиєһ, доодпеѕѕ 1Р-уоц-м111, еасй тотеп; 
ѕе1есї (а1мауѕ), Іепоіһ(оғ-дауѕ) 


# 1іѕтеп (а рег1 роет) 
# Ѕһагоп Норкіпѕ 
# геу. Јипе 19, 1995 


Достоинства программиста на Рей 


Лень 


Лень программиста напоминает одноименный человеческий недостаток, но 
есть разница. Недостаток выражается в отлынивании от текущей работы. Дос- 
тоинство же выражается в отлынивании от работы в будущем. Программи- 
сты, имеющие доступ к мощи Ре, создают инструменты, упрощающие реше- 
ние задач. Рей — серьезный язык автоматизации задач, и чем более высокий 
уровень автоматизации будет достигнут сегодня, тем меньше ручного труда 
выпадет на долю программиста завтра. 


Нетерпеливость 
Нетерпеливость — жуткое чувство, возникающее, когда компьютер делает все 
что угодно, только не то, что нужно. Или, выражаясь точнее, когда програм- 
мист по ту сторону программного продукта выбрал неправильные настройки 
по умолчанию, создал неудобный графический интерфейс или не предоставил 
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доступ к этим данным. Вы достаточно испытали этих неприятных ощущений, 
чтобы не заставлять других испытывать их, а, стало быть, обернуть свои рас- 
стройства и потраченное время на пользу другим. 


Высокомерие 


Высокомерие – это чувство, что при наличии необходимых инструментов воз- 
можным становится практически все. Решение любой сложной задачи — это 
Всего Лишь Вопрос Программирования, правильно? Однако это же чувство 
может заставить вас подлететь слишком близко к Солнцу. 


События 


Практически каждую неделю в экосистеме Рег| происходит какое-то собызие. 
Ниже перечислены некоторые из основных событий. Большинство из них можно 
найти в списке событий «Тһе Ре! Кеуіем Соттџпіїу Са]епдаг» (ћір://іһерегігер- 
еш.сот/соттипіїу саіепӣаг). 


Тһе Рей Сопјегепсе, ОЅСОМ 


Конференция «Тһе Ре! Сопѓегепсе», организованная издательством О’НешШу & 
А звѕосіаїеѕ в 1997 году, была не первым событием в экосистеме Рен, но, вероят- 
но, одним из важнейших. На этой конференции маленькая группа жителей 
Нью-Йорка организовала первую группу пользователей Рей, МУ.рт (#р:// 
пу.рт.ога). Это привело к созданию ряда других групп пользователей Рей в том 
же году; в течение пары лет появились еще сотни групп. «Тһе Рег] Сопѓегепсе» 
выросла до организации «Тһе Ореп Бойгсе Сопѓегепсе», или просто ОБСОМ. 


УАРС 


УАРС, или «Үеё Апотег Рег! Сопѓегепсе» (еще одна конференция пользовате- 
лей Рей), приобрела множество форм и охватывает по меньшей мере четыре 
континента. Каждый год одна из этих малобюджетных, массовых и, как пра- 
вило, некоммерческих конференций проводится в Азии, Европе, Северной 
и Южной Америке. Несмотря на одинаковые названия, это различные орга- 
низации. 


Реті М/огЕѕћорѕ 


Конференции ҮАРС длятся по несколько дней, тогда как встречи «Рей МогК- 
вһор» обычно занимают один-два дня и посвящены определенной теме, напри- 
мер, на семинаре «Регі ФА МогЕѕһор» обсуждаются проблемы инфраструкту- 
ры СРАМ“ и тестирования программ на Ре. Немногие знают, что первым со- 
бытием в экосистеме Ре! стала организация семинара «Сегшаг Рей У’огК- 
Вор», прошедшего даже до созыва конференции «Тһе Рег] Сопѓегепсе». 
НасВаіћопзѕ 

Наименее организованным событием в экосистеме Рег являются встречи 
«Наскаопз», на которых пользователи Ре’ собираются, чтобы поработать 


вместе. Иногда эти встречи посвящены определенной теме, а иногда люди со- 
бираются, чтобы поработать вместе над своими проектами в одной комнате. 
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Гдеи как получить помощь 


Программисты на Рег] чаще других стремятся прийти на помощь, это замечают 
даже те, кому не нравится Регі. Мы думаем, что Ре, уходящий корнями в самые 
разные языки программирования, привлекает людей с особым складом характе- 
ра, которым нравятся разные языки, а не только тот, которым они пользуются. 
Возможно, они склонны находить пользу во всем. 


Если вы ищете ответы на вопросы, в Интернете можно найти множество фору- 
мов, участники которых готовы прийти вам на помощь. Ниже перечислены наи- 
более известные из них: 


ВИр://рей4дос.ре[.огя 


Содержит всю электронную документацию по языку Рей, без которой невоз- 
можно жить и работать, даже если ваша платформа или система управления 
пакетами думает иначе. Да, некоторые компании поставляют регі без руко- 
водств. 


Теагп Регі (Вир:/Леагп.реп.ога) 


Этот веб-сайт — начальная точка поиска ресурсов для начинающих, включая 
перечисленные здесь. 


Ре Бесіппегѕ тайтя Из 


Кейси Уэст (Сазеу Меѕі) создал этот список рассылки как надежный источник 
информации, где самые зеленые новички могут задавать простейшие вопро- 
сы, не опасаясь насмешек. Другие форумы могут быть более, гм-м, неуправ- 
ляемыми и способны вызывать неприятные эмоции у начинающих програм- 
мистов на Рег]. 


РегітопЕз (ВНр://шшш.рейтопЁз.огЕ) 


РегрпопЕѕ — это электронная доска объявлений, посвященная языку Рег]. Ко- 
нечно, это не справочное бюро, но если вы хорошо потрудились и задали инте- 
ресный вопрос, вы наверняка быстро получите качественную помощь. Но для 
начала рекомендуем прочитать руководство брайана по решению любых про- 
блем в Рег! («Ы“ап?’з Сиіде фо Боушй Апу Рей Ргоеть», #ёр://иллш.рейтопё. 
огя/?поде_14=376075)/1 


8аскооегћош (Һіїр:/Ј/шшш.ѕіасЕооегћош.сот) 


Ѕіаскоуег ож — известный сайт, построенный пс принципу «вопрос-ответ» 
и посвященный общим вопросам программирования. Даже при том, что он не 
посвящен конкретно Рен, здесь достаточно завсегдатаев, являющихся экспер- 
тами по этому языку. Они с удовольствием ответят на ваши вопросы. 


Ваша местная группа пользователей Рей 


В мире существуют сотни групп пользователей Реп. И хотя каждая из них 
имеет свои особенности, это отличный способ найти и познакомиться с поль- 
зователями Ре], живущими рядом с вами (или не рядом). Многие из этих 
групп проводят свои семинары и встречи. Найти ближайшую группу можно 
на сайте ВНр://шило.рт.ога, а если поблизости не окажется такой группы, соз- 
дайте свою! 


1 Это руководство приводится также в книге «Мазегшя Реп». 
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Телеконференции Оѕепеї 


Телеконференции, посвященные Ре!|, — кладезь информации, хотя иногда 
и неупорядоченной. Первую остановку можно сделать на пешѕ:сотр.Іап&.регі. 
тодегае4, регулируемой телеконференции с небольшой активностью. Здесь 
появляются обновления и проходят технические дискуссии. Благодаря регу- 
лированию, эта телеконференция вполне удобочитаема. 


В группе пешѕ:сотр.Іап&.регі.тізѕс с высокой активностью обсуждается все, от 
технических проблем и философии Ре! до игр и поэзии на Реті. Как и сам 
Рей, группа пешз:сотр4апя.ре|.пизс нацелена на оказание помощи, и ника- 
кой вопрос здесь не будет выглядеть глупым. 


Если для доступа к Озепеф вы пользуетесь браузером, а не обычным клиентом 
чтения новостей, добавьте префикс пешѕ: перед именем группы, чтобы перей- 
ти к ней. (Такой прием действует, только если у вас имеется сервер новостей.) 
В противном случае можно использовать службу поиска в Озепеф, такую как 
Соор1е Сгоцрз (№ Ир://вгоирз.вооте.сот/), указав +рег1* в строке поиска. 


Списки рассылки 


Многие темы, общие или конкретные, обычно имеют собственные списки рас- 
сылки. Многие из них перечислены на сайте йИр://йз1.ре\|.огя. Списки рас- 
сылки часто можно найти на веб-сайтах проектов. Для поиска архивов многих 
списков рассылки можно также пользоваться такими сайтами, как ВНр:// 
тагЕтай.оге. 


ТВС 


Чаты Интернета (Іпёегпеё Веау Сһаѓ, ІКС) – еще одно средство общения про- 
граммистов на Ре!|, и, если вам нравится такой стиль общения, вы без труда 
найдете множество желающих поболтать с вами. Такие чаты обычно не счита- 
ются местом, где можно получить помощь, поэтому вопросы без предваритель- 
ного знакомства здесь обычно расцениваются, как появление на вечеринке без 
приглашения. Однако некоторые каналы, такие как #регі-ћеір и #илт32, пред- 
назначены специально для оказания помощи. Кроме того, множество каналов 
ТВС можно найти на сайте ћіїр://шил.ігс.регі.оге/. 


Конечно, есть вопросы слишком глупые, чтобы отвечате на них. (Особенно если ответы 
на них уже имеются в электронных страницах справочного руководства и сборниках 
ответов на часто задаваемые вопросы. Зачем просить помощи в телеконференции, если 
тот же самый ответ можно найти самому гораздо раньше, чем вы закончите набирать 
свой вопрос?) 


Справочный материал 


Специальные имена 


Эта глава посвящена переменным, которые имеют в Рег] особое значение. Для 
большинства имен, содержащих знаки пунктуации, есть хорошие мнемоники 
или аналоги в какой-нибудь оболочке (или же и то и другое). Но если вы хотите 
использовать в качестве синонимов длинные имена переменных, просто скажите 
в начале программы: 


иџѕе Епд113Н “-по_мафсй_маг$”; 


В результате в текущем пакете для всех коротких имен будут установлень псев- 
донимы в виде длинных имен. У некоторых из этих переменных даже есть сред- 
ние имена, обычно заимствованные из ашЁ. Большинство в конечном счете оста- 
навливает выбор на коротких именах, по крайней мере, для самых востребован- 
ных переменных. В данной книге мы систематически используем короткие име- 
на, но часто указываем и длинные (в скобках), чтобы их легко можно было найти 
в данной главе. 


Семантика этих переменных бывает очевидно волшебной. (Как творить собствен- 
ное волшебство, мы рассказали в главе 14.) Некоторые из них доступны только 
для чтения. При попытке присвоить им значения возникает исключительная си- 
туация. 

Ниже сначала приводится полный список переменных и функций, имеющих 
в Рег] особое значение и сгруппированных по типу, чтобы можно было находить 
переменные, в точном названии которых вы не уверены. Затем следуют описания 
всех переменных в алфавитном порядке их правильных имен (или наименее не- 
правильных). 


Специальные имена, сгруппированные по типам 


Мы вольно употребили слово «тип» — представленные разделы объединяют пере- 
менные скорее по области видимости. 
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Специальные переменные регулярных выражений 


Следующие специальные перемевные, связанные с поиском по шаблону, видны 
во всей динамической области видимости, где выполняется поиск. Иными слова 
ми, ведут себя, как будто объявлены как 10са1, поэтому вам не нужно самим объ 

являть их таким образом. См. главу 5. 


$91911$ 


$& ($МАТСН) 
$° (ФРОЅТМАТСН) 
$` ($ФРВЕМАТСН) 


$ {ПМАТСН} 
${ПРОЗТМАТСН} 
${ПРАЕМАТСН} 


$+ ($.АЅТ РАВЕМ МАТСН) 
%+ (УГАЗТ_РАВЕМ_МАТСН) 
@+ (@АЅТ МАТСН ЕМО) 


@- 
%- 


9А ($_АЅТ ВЕСЕХР СОЕ ВЕЅЏІТ) 
$7№ ($.АЅТ ЅИВМАТСН_ ВЕЕТ) 


Переменные дескриптора файла 


Эти специальные переменные не требуется определять как 10са1, потому что они 
всегда указывают на значение, относящееся к выбранному в данный момент де- 
скриптору вывода, — каждый дескриптор сохраняет собственный набор значе- 
ний. Когда с помощью ѕе]есї выбирается новый дескриптор файла, прежний за- 
поминает значения, которые имели эти переменные, а переменные начинают от- 
ражать значения нового дескриптора. См. также описание модуля 10: :Напд1е. 


$! (ФАУТОЕЦУ$Н, ФОЦТРИТ_АУТОРЦУЗН) 
$- (ФРОВМАТ 1ТМЕЗ_СЕРТ) 

$= (ФРОВМАТ _ТМЕЅ РЕВ_РАСЕ) 

$- ($РОВМАТ_МАМЕ) 

$% ($РОВМАТ_РАВЕ_МОМВЕН) 

$7 (ФРЕОЯМАТ ТОР МАМЕ) 


Специальные переменные пакетов 


Эти переменные существуют отдельно в каждом пакете. Нужды в их локализа- 
ции не должно быть, поскольку ѕ0гі автоматически делает это для $а и $0, а ос- 
тальные, скорее всего, лучше оставить в покое (хотя при использовании директи- 
вы и5е ѕїгісі потребуется объявить их как оџг). 


фа 
ФАЦТОГОАВ 
$6 
@ЕХРОВТ 
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@ЕХРОНТ_ОК 
ФЕХРОНТ _ТАб$ 
ЖЕІЕГ05 
@ТЗА 
ХОМЕНГОАЮ 
$МЕВЅІОМ 


Специальные переменные для всей программы 


Эти переменные действительно являются глобальными в самом широком смыс- 
ле – они означают одно и то же в каждом пакете, так как переадресовываются 
в пакет паіп, при использовании неквалифицированных имен (за исключением 
@Ё, которая является специальной в паіп, но принудительная переадресация на 
нее не выполняется). Если потребуется временный экземпляр одной из этих пере- 
менных, локализуйте его в текущей динамической области видимости. 


ЕМУ 
%! (ЖЕАА№О, %0$_ЕВВОВ) 
%ІМС 
516 
%^Н 


ш 
@ААСУ 
@ТМС 


$ 
$0 ($РВОСВАМ_МАМЕ) 
$АВОМ 


$! (ФЕВА№, $05 ЕВВОВ) 

$" (Ф_15Т ЅЕРАВАТОВ) 

$$ (ФРІ, $РАОСЕЅ5 Ір) 

$( ($610, ФВЕАІ СВО0Р 10) 

$) ($Е0І0, $ЕРЕЕСТТУЕ_СВОУР_ТО) 

$ (ФОЕ, $ОИТРИТ_ЕТЕГО_ЗЕРАВАТОН) 
$ (ФМА, ФТМРУТ ЕТМЕ_ММВЕН) 

$/ ($45, ФІМРОТ АЕСОВО_ ЅЕРАВАТОВ) 
$. (ФЕОАМАТ 1ТМЕ_ВВЕАК_СНАВАСТЕВ$) 
$; ($50В5ЕР, $ЗУВ$САТРТ_ЗЕРАВАТОН) 
$< (ФИТО, $АЕАЕ ЏЅЕВ 10) 

$> ($Е0ТО, ФЕҒЕЕСТІМЕ ЏЅЕВ 10) 

$? (ФСНІСО ЕВВОВ) 

$@ (ФЕҮАІ._ЕВАОА) 

$ 

$\ ($085, $ОИТРИТ_ВЕСОВО ЅЕРАВАТОВ) 
$1 

$^А (ФАССУМИГАТОВ) 

$7С ($СОМРІІІМС) 

$70 ($0ЕВОСОІМС) 

${ "ЕМСОРІМО} 

$7Е ($ЕХТЕМОЕР_ 05 ЕАВОА) 
Ф{701.0ВАІ_РНАЅЕ} 

ФЕ ($5ҮЅТЕМ ЕЮ МАХ) 
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-Н 
І ($ТНРЕАСЕ_ЕОТТ) 
Е ($РОАМАТ_РОВМЕЕЕО) 
^м 
20 ($05МАМЕ) 

{ОРЕМ} 

^Р ($РЕВІрВ) 

$ ($1А$Т ВЕСЕХР_ СОЕ _ВЕЗИЕТ) 
${ ВЕ РЕВЫС ЕГАС$} 
${7ВЕ_ ТАІЕ, МАХЫЏР) 

$75 ($ЕХСЕРТТОМЅ ВЕІМО_САЏОНТ) 
$-Т ($ВАЅЕТІМЕ) 

${ТАІМТ} 

${70МІСОВЕ} 

$ {"ОТЕВСАСНЕ} 

${7ОТЕВІОСАГЕ} 

$7ү ($РЕАІ МЕВЅТОМ) 

$7 ($МАВМІМС) 

${"МАВМІМО ВІТ9} 

${7МТРЕ $ҮЅТЕМ_САШ.9} 
${7МІМЗ2_$1_0РРҮ ТАТ} 

$-Х (ФЕХЕСИТАВЕЕ_МАМЕ) 


$ 
$ 
$ 
$ 
$ 
$ 
$ 


Специальные дескрипторы файлов для пакетов 


За исключением дескриптора ВАТА, который всегда относится к текущему пакету, 
следующие дескрипторы файлов относятся к паіп, если не квалифицированы 
именем другого пакета: 

_ # (подчеркивание) 

АВСУ 

АВСУОЦТ 

ВАТА 

ЭТОМ 

УтоОчТ 

ЭТОЕВЯ 


Специальные функции для пакетов 


Следующие имена подпрограмм имеют для Ре! особое значение. Онг всегда вы- 
зываются неявно при возникновении некоторых событий, таких как доступ 
к связанным переменным или попытка вызвать не определенную функцию. Мы 
не описываем их в этой главе, поскольку они широко освещаются на протяжении 
всей книги. 


Перехватчик вызова неопределенной функции (см. главу 10): 
АЦТОГОАО 

Завершение отживших свое объектов (см. главу 12): 
БЕЗТВОУ 

Объекты исключительных ситуаций (см. 0іе в главе 27): 


РВОРАСАТЕ 
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Функции автоматической инициализации и автоматической уборки (см. гла- 
ву 18): 


ВЕСІМ, СНЕСК. УМТТСНЕСК. ІМІТ, ЕМО 


Поддержка многопоточной модели выполнения 
СОМЕ, СОМЕ КІР 


Методы связывания (см. главу 14): 


ВІММОЕ, СІЕАВ, С105Е, ОЕГЕТЕ, реЕЅТАОҮ, ЕОҒ, ЕХТЗТ$, ЕХТЕМО, 
РЕТСН, РЕТСНУТ7Е, РІГЕМО, ҒІВЅТКЕҮ, СЕТС, МЕХТКЕУ, ОРЕМ, РОР, 
РВІМТ, РАТМТЕ РУЗН, ВЕАО, ВЕАОГІМЕ, ЗСАБАВ, ЅЕЕК, ЭНТЕТ, 
ЅРІІСЕ, ЗТОВЕ, 5ТОВЕЅІЈЕ, ТЕМ. ТТЕААВАУ, ТІЕНАМОГЕ, ТТЕНАЗН, 
ТТЕЗСАЕАВ, ИМЗНТЕТ, МАІТЕ. 


Специальные переменные 
в алфавитном порядке 


Мы привели эти переменные в алфавитном порядке их длинных имен. Если вы 
не знаете длинного имени переменной, можете найти его в предыдущем разделе. 
(Переменные, не имеющие буквенного имени, вынесены вперед.) 


Чтобы не повторяться, каждое описание переменной начинается с одного из обо- 
значений, перечисленных в табл. 25.1: 


Таблица 25.1. Обозначения для специальных переменных 


Обозначение | Смысл 


ххх Устарела, не используйте в новом коде. 

МОТ №оё ОР ісіаПу Тћеге (только для внутреннего использования). 

КМУ Удалена из Рег]. 

АЦ, Подлинно глобальная, используется всеми пакетами. 

РКС Глобальная для пакета; в каждом пакете может быть своя. 

ЕНА Атрибут дескриптора файла; один на каждый объект ввода/вывода. 

РУМ Автоматическая динамическая область видимости (подразумевается А 1). 
ТЕХ Лексическая область видимости на этапе компиляции. 

КО Только для чтения (Веад Опіу), создает исключительную ситуацию при мо- 


дификации. 


Если перечислено несколько имен переменных или символов, по умолчанию ис- 
пользуется только короткое имя. Применение модуля Епд1іѕћ делает доступными 
длинные синонимы и только в текущем пакете, даже если переменная помечена 
как [АЛ]. 


Заголовки статей, имеющие вид пеѓлой НАМОЕЕ ЕХРЕ, отражают объектно-ориенти- 
рованные интерфейсы к переменным для дескрипторов файлов, предоставляе- 
мым модулем 10::Напб1е и различными модулями 10::. (При желании можно ис- 
пользовать форму записи НАМОЕЕ->теЁной (ЕХРВ).) Они позволяют избежать необхо- 
димости вызывать ѕе1есі для смены дескриптора файла вывода по умолчанию 
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при просмотре или изменении этой переменной. Все такие методы возвращают 
прежнее значение атрибута; новое значение присваивается, если задан аргумент 
ЕХРВ. Если он не задан, большинство методов ничего не делает с текущим значени- 
ем, за исключением аџїоѓ1иѕћ, который принимает аргумент 1, просто чтобы чем-то 
выделичься. 


$ [АБ Пространство по умолчанию для ввода и поиска по шаблону. Следую- 
щие пары эквивалентны: 


мћіЛе (<>) {...} # эквивалентны только в обычной проверке мп11е 
мһіле (деѓіпей($_ = <>)) {...} 


сһотр 
сһотр($_) 


/75џрјесї: / 
$ =- /75џирјесі: / 


Тг/а-2/А-2/ 
$ =- г/а-2/А-2/ 


Ниже перечислено, где по умолчанию используется переменная $ ‚если явно 
не определено другое: 


Списочные функции, например ргіпї, ипііпк; унарные функции, такие 
как ого, роз и іпі; а также все проверки файлов, кроме -ї, которая по умол- 
чанию выполняется для 5Т01\. Все функции, по умолчанию использую- 
щие $_, отмечены также в главе 27. 


Операции поиска по шаблону п// и 5///, а также операции транслитерации 
у/// и 1г///, когда они используются без оператора =”. 


Переменная итерации в цикле ѓогеасћ (даже в виде Гог или когда выступа- 
ет в качестве модификатора команды), если не задана другая переменная. 


Неявная переменная итерации в функциях огер и пар. (Задать для них 
другую переменную невозможно.) 


Место по умолчанию для входной записи, когда истинность результата 
операции <ЕН>, геад1іпе или 0100 является единственным критерием для 
оператора мћі1е. Это присваивание не производится вне выражения про- 
верки условия мһі1е или когда в это выражение включены дополнитель- 
ные элементы. 


Поскольку $_ является глобальной переменной, она иногда может давать не- 
желательные побочные эффекты. Начиная с версии у5.10 имеется возмож- 
ность использовать приватную (лексическую) версию переменной $_, объявив 
ее как пу. Кроме того, объявление оуг $_ восстанавливает доступ к глобаль- 
ной переменной $ в текущей области видимости. 


(Мнемоника: подчеркивание в некоторых операциях подчеркивает исполь- 
зуемый операнд.) 


© [АГ] Внутри подпрограммы этот массив содержит список аргументов, пере- 


данных подпрограмме. См. главу 7. 
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(подчеркивание) 


[А11] Специальный дескриптор файла, используемый для кэширования ин- 
формации последнего успешного выполнения оператора ѕїаї, 15+аї или про- 
верки файла (такой как -м $111е или -0 $1116). 


$иифры 


$] 


Я 


фи 


ГРУМ,ВО] Нумерованные переменные $1, $2 и т.д. (до нужной вам величины)! 
содержат текст, соответствующий очередной паре круглых скобок последне- 
го успешно сопоставленного шаблона в активной в данный момент динами- 
ческой области видимости. (Мнемоника: как \цифры.) 


[АТ] Возвращает номер версии + уровень исправлений (рабсШеуе!/1000). 
Может использоваться в начале сценария для определения пригодности 
имеющейся версии интерпретатора Рен. (Мнемоника: эта версия Ре! в пра- 
вильных рамках?) Пример: 


маги "№ спескзити ло! \п” 1 $] < 3.019: 
діе "Мизф һауе ргоёотуріпо амаі1ар1е\п” 11 $] < 5.003; 


См. также описание директив изе УЕВЗТОМ и гедиіге УЕРУТОМ, обеспечивающих 
более удобный способ завершения работы, если версия интериретатора Рей 
слишком старая. См. описание $^\/ как более гибкого представления версии 
Рег]. 


[ХХХ,/ЕХ] Индекс первого элемента в массиве и первого символа в подстро- 
ке. По умолчанию 0, но мы, бывало, устанавливали его в 1, чтобы Рей боль- 
ше походил на ашЁ (или ЕОКТВАМ) при индексации и вычислении функций 
1пдех и ѕзибѕїг. Поскольку присваивание $[ было признано очень опасным, оно 
интерпретируется теперь как директива компилятора с лексической види- 
мостью и не может повлиять на какие-либо другие файлы. (Мнемоника: [ на- 
чинает индексы.) 


[ВМУ, АЦ] Удалена в версии у5.10. Не применяйте ее, используйте вместо 
нее ргіпії. $# содержит формат вывода чисел через ргіпї, что было нереши- 
тельной попыткой эмулировать переменную ОҒМТ из аш. (Мнемоника: # яв- 
ляется знаком номера, но если вы умны (ѕћагр)?, то забудьте об этом, чтобы 
не превратить свою программу в мешанину и понести за это наказание.) 


Это не разыменовывающий символ, который используется перед именами 
массивов, чтобы определить индекс последнего элемента, как в выражении 
ф#ААААҮ. Эти две пары символов никак не связаны друг с другом. 


[ВМУ,АГИ Эту ныне усопшую переменную когда-то можно было установить 
в истинное значение, чтобы заставить Рен предполагать наличие модифика- 
тора /п в каждом шаблоне, где отсутствует явный модификатор /ѕ. Была уда- 
лена в Реп версии у5.10. (Мнемоника: + соответствует множеству вещей.) 


Хотя многие механизмы регулярных выражений поддерживают лишь до девяти об- 
ратных ссылок на найденный текст, в Рег! такого ограничения нет, поэтому если напи 
сать $768, Ре! не станет возражать, в отличие от тех, кому придется сопровождать этот 
код, если в регулярном выражении действительно использовано столько скобок. 


Игра слов – «ѕһагр» в переводе также означает «диез» (знак #). – Прим. перев. 
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%- ШҮМ№,БКО] Действует подобно %+ (М АЅТ_ РАВЕМ _МАТСН). Обеспечивает доступ 
к именованным сохраняющим группам в последней успешной операции 
поиска по шаблону, в текущей активной динамической области видимости. 
Ключами этого хеша являются имена сохраняющих групп, а значениями — 
массив ссылок. Каждый массив содержит фрагменты, соответствующие всем 
группам с тем же именем, которых может быть несколько, в порядке следова- 
ния в шаблоне. 


Не смешивайте вызовы еасп с этим хешем и поиск по шаблону в цикле, иначе 
вы будете получать противоречивые результаты. 


Если вам не нравится форма записи $-{МАМЕ}[0], используйте стандартный 
модуль Тіе::Наѕћ::МапедСарїиге, чтобы создать собственный псевдоним для пе- 
ременной %-. 


$а [РКС] Эта переменная используется функцией ѕогї для хранения первого из 
пары сравниваемых значений ($0 содержит второе значение каждой пары). 
Переменная $а принадлежит пакету, куда был скомпилирован оператор $0гї, 
и не обязательно тому же, куда была скомпилирована его функция сравне- 
ния. Эта переменная неявно локализуется в блоке сравнения $0г{ и является 
глобальной, так что не вызывает претензий со стороны изе ѕїгісї. Поскольку 
это псевдоним для фактического массива, может показаться, что массив мож- 
но модифицировать через переменную, однако делать этого не стоит. См. опи- 
сание 50гї. 


ФАССИМИЕАТОВ 


$`А [АЦ Текущее значение накопителя иг е для строк ѓогпаї. Формат содержит 
команды Гоги 1пе, которые помещают свой результат в $`А. После вызова сво- 
его формата "ге выводит содержимое $^А и очищает ее. Поэтому вы никогда 
фактически не видите содержимого $^А, если только не вызовете Гогт11те са- 
мостоятельно, а потом не посмотрите на результат вызова. См. описание 
функции Гоги! пе. 


АВСУ 
[АТ] Специальный дескриптор файла, который перебирает все содержа 
щиеся в командной строке имена файлов (из переменной @АВС\/). Обычно за- 
писывается как пустой дескриптор файла в операторе угловых скобок: <>. 
ФАВСУ 
[АШ Содержит имя текущего файла при чтении из дескриптора АНб\ в слу- 
чае применения операторов <> или геай1іпе. 
@АНС\У 


[А11] Массив с аргументами командной строки для сценария. Заметьте, что 
значение $#ААСУ обычно равно числу аргументов минус один, так как $АВС\У[0] 
является первым аргументом, а не именем команды; используйте ѕса]аг 
@АВСУ для получения количества аргументов программы. Имя программы 
можно найти в $0. 


АВСУОИТ 


[АТ] Специальный указатель файла, используемый при обработке указате- 
ля АВС\ с ключом -ё или переменной $`Т. См. описание ключа -і в главе 11. 
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ФАОТОГСАО 


[РКС] В ходе выполнения метода АЦТО! ОАО эта переменная, глобальная для па- 
кета, содержит полное квалифицированное имя функции, от имени которой 
был запущен метод АТО ОАР. См. главу 25. 


$6 [РКС]Эта переменная, спутница $а, используется в сравнениях ѕ0гі. Подроб- 
ности см. в описании $а и функции ѕогї. 


$ВАЅЕТІМЕ 


$`Т [АБ] Момент времени, когда начал выполняться сценарий, в секундах после 
начала эпохи (для систем ОМХ - начало 1970 года). Значения, возвращае- 
мые проверками файлов -М, -А и -С, вычисляются относительно этого момен- 
та времени. 


$СНТЕО_ЕВВОВ 


$? [АШ] Код состояния, полученный последней операцией закрытия канала, 
командой `` (обратные апострофы) или функциями маії, маіїрій и ѕуѕїет. Об- 
ратите внимание, что это не просто код завершения, а целое 16-разрядное 
слово состояния, возвращаемое системными вызовами шай(2) или шайра(2) 
(или эквивалентными). Код завершения порожденного процесса находится 
в старшем байте, т.е. $? >> 8. Результат операции с младшим байтом $? & 127 
сообщает, какой сигнал (если он был) послужил причиной завершения про- 
цесса, а результат операции $7 & 128 сообщает, последовала ли за его заверше- 
нием операция записи образа памяти на диск. (Мнемоника: аналогична $? 
в зћ и ее потомках.) 


Внутри блока ЕМ переменная $? содержит значение, которое должно быть пе- 
редано ехії. Переменную $? можно изменить в ЕМ, чтобы вернуть другой код 
завершения сценария. Например: 


ЕМО { 
$7 = 1 ЇҒ $? == 255: в теперь діе вернет кол завершения 255 


} 


В системе УМ8 использование прагмы изе утѕіѕћ "ѕіаїиѕ” приводит к тому, 
что в $? отражается подлинный код завершения УМ, а не эмулируемый по 
умолчанию код завершения РОХХ. 


Если переменная һ_еггпо поддерживается в С, ее числовое значение возвра- 
щается через $7, когда одна из функций 9е11051*() терпит неудачу. 


$СОМРТЕТМС 


$С [АБ Текущее состояние внутреннего флага, связанное с ключом -с. В ос- 
новном полезно в сочетании с -МО-..., чтобы позволить коду изменять свое 
поведение. Например, метод АЦТОЕ ОАО может потребоваться выполнить на эта- 
пе компиляции, вместо использования обычной отложенной загрузки, что- 
бы код был сгенерирован немедленно. Установка значения $°С = 1 сродни 
вызову В::тіпиѕ_с. См. главу 16. 


БАТА 


[РКС] Этот специальный дескриптор файла ссылается на все, что расположе- 
но в текущем файле за маркерами __Е\№__ или __ПАТА__. Маркер __Е№__ всегда. 
открывает дескриптор файла паіп::ПАТА, поэтому используется в основной 
программе. Маркер __ПАТА__ открывает дескриптор АТА в текущем пакете, 
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поэтому различные модули могут иметь собственные дескрипторы файла 
ПАТА, поскольку они (предположительно) имеют различные имена пакетов. 


ФРЕВОССІМ№С 


$0 [АШ Текущее значение внутренних флагов отладки, установленных клю- 
чом командной строки -Р; значения разрядов см. в разделе «Ключи», в гла- 
ве 17. По аналогии с командной строкой, этой переменной можно присваи- 
вать числовые или символьные значения, например: $70 = 10 или $70 = *51". 


(Мнемоника: значение ключа -Р.) 
${7ЕМСОрІМО) 


[ХХХ,АГ Ссылка на объект Епсойе, используемый для преобразования ис- 
ходного кода в Юникод. Благодаря этой переменной отпадает необходимость 
писать сценарии на Ре! в кодировке ОТЕ-8. По умолчанию имеет значение 
ипде#. Прямое управление этой переменной не рекомендуется. 


Была добавлена в Ре! версии у5.8.2. 
ФЕРЕЕСТТУЕ _СВОУР_ТО 


$) [АШ Текущий СІР (ТО группы) данного процесса. Если платформа поддер- 
живает одновременное членство в нескольких группах, $) позволяет полу- 
чить список групп, элементы которого разделены пробелами. Первое число 
равно значению, возвращаемому &е{1ев14(2), а последующие – числам, возвра- 
щаемым ветгоирз(2), одно из которых может совпадать с первым. 


Точно так же значение, присваиваемое $), должно быть списком чисел, эле- 
менты которого разделены пробелами. Первое число используется для уста- 
новки текущего СТО, а остальные (если имеются) передаются системному вы- 
зову зе тгоирз(2). Чтобы задать для ѕеїдгоирѕ пустой список, просто повтори- 
те новый текущий СТО; например, чтобы установить текущий СІР в значе- 
ние 5 и указать пустой список для ѕеїдгоирѕ, скажите: 


$) = "5 5"; 


(Мнемоника: круглые скобки применяются для группировки объектов. Теку- 
щий СІр - это ваша группа, если вы выполняете зеё 514.) Заметьте: $<, $>, $( 
и $) могут устанавливаться только на машинах, поддерживающих соответ- 
ствующую системную процедуру ѕеііӣ. $( и $) можно менять местами только 
на машинах, поддерживающих ѕеѓғесі4(2). 


ФЕРРЕСТТУЕ ©ЗЕН_ТО 


$> [АЦ] Текущий 01р данного процесса, возвращаемый системным вызовом 
сеіеиій(2). Пример: 


$< = $2; # присвоить действительный иіб текущему 
($<,$>) = ($>,$<); # поменять местами действительный и текущий џій 


Текущий и действительный ОТО можно изменить одновременно с помощью 
РОЗ1Х: :зети19. После изменения $> необходимо проверить $!, чтобы выявить 
возможные ошибки, возникшие при попытке изменения. 


(Мнемоника: это ОТО, на который вы перешли при выполнении зейна.) При- 
мечание: $< и $> можно менять местами только на машинах, поддерживаю- 
щих зетеша(2). И то не всегда. 
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ФЕМУ 


[АГ Хеш, содержащий текущие переменные среды. Присваивание %Е№\ из- 
меняет среду как главного процесса, так и процессов, порожденных главным 
после присваивания. (Таким способом нельзя изменить окружение роди- 
тельского процесса в любой системе, сходной с ОМІХ.) 


ФЕМУ{РАТН} = "/біп: /иѕг/біп"; 

ФЕМУ{РАСЕВ} = °1е$$°; 

ФЕММ{1ЕЗ$} = “МОе1сзпЕ”; # наши любимые ключи для 1е$$(1) 
зузфет "тап рег1”; # получает новые установки 


Чтобы удалить что-либо из окружения, вызовите функцию Пйе1еїе вместо 
присваивания значения ипдеТ элементу хеша. 


Обратите внимание, что процессы, выполняющиеся как записи сгоаб(5), на- 
следуют особенно узкий набор переменных среды. (Если программа прекрас- 
но выполняется из командной строки, но не под сгоп, возможно, причина 
в этом.) Заметьте также, что необходимо установить ФЕМУ{РАТН}, ФЕМИ{ЅНЕ }, 
ФЕМИ{ВАЅН_ ЕМУ) и $ЕМАТЕ$}, если сценарий выполняется как зева. См. главу 20. 


ФЕМАІ _ЕВАОА 


$0 [А1] Текущее активное исключение или сообщение о синтаксической ошиб- 
ке Ре! в последней операции е\а1. (Мнемоника: в каком месте («аё») была 
синтаксическая ошибка?) В отличие от $! ($05 ЕВАОВ), которая устанавливает- 
ся при неудаче, но не очищается при успехе, $@ всегда устанавливается (в ис- 
тинное значение), если во время выполнения в последнем вызове еуа] возник- 
ла ошибка компиляции или исключительная ситуация, и всегда сбрасывает- 
ся (в ложное значение), если таких проблем не возникло. 


Предупреждения в $6 не сохраняются. Однако можно определить процедуру 
обработки предупреждений, установив $516{__МАНК__}, как описывается да- 
лее в этом разделе. 


Заметьте, что значением $@ может быть не строка, а объект исключительной 
ситуации. Даже в этом случае с ним, вероятно, можно работать как со стро- 
кой, если в классе объекта исключительной ситуации определена перегру- 
женная операция преобразования в строку. Если для распространения ис- 
ключительной ситуации применятся команда: 


91е 1? $6; 


объект исключительной ситуации вызовет $@->РКОРАСАТЕ, чтобы решить, что 
делать. (Строковая исключительная ситуация просто добавляет к строке 
«ргорараќеа аф».) 


ФЕХСЕРТТОМ$ ВЕІМО СА0СНТ 


$5 [АЦ Эта переменная отражает текущее состояние интерпретатора, воз- 
вращая истинное значение при нахождении внутри е\уа1 и ложное в против- 
ном случае. Она не определена, если анализ текущей единицы компиля- 
ции еще не завершен, что может происходить в обработчиках $516{__ОТЕ__} 
и $516{ МААМ__}. (Мнемоника: состояние е\а1.) 


ФЕХЕСОТАВІЕ_ МАМЕ 
$`Х [АШ Название двоичного модуля регі, взятое из агоу[0] в С. 
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@ЕХРОНТ 


[РКС] К этой переменной-массиву обращается метод 1трог{ модуля Ехрогїег 
при поиске списка других переменных и подпрограмм пакета, которые нуж- 
но экспортировать по умолчанию при загрузке модуля директивой изе или 
в случае применения тега импорта :ОЕРАЦТ. Эта переменная не является ис- 
ключением для изе ѕїгісї, поэтому ее нужно объявлять как оиг или исполь- 
зовать полное имя, квалифицированное именем пакета, в области действия 
этой прагмы. Однако все переменные, имена которых начинаются строкой 
«ЕХРОКТ», исключаются из предупреждений об однократном применении. 
См. главу 11. 


@ЕХРОВТ ОК 


[РКС] К этой переменной-массиву обращается метод іпрогї модуля Ехрогїег, 
чтобы определить, является ли законным запрашиваемый импорт. Она не 
является исключением для и5е ѕїгісї. См. главу 11. 


УЕХРОНТ_ТАб$ 


[РКС] К этой переменной-хешу обращается метод 1трог{ модуля ЕхрогТег, ко- 
гда запрашивается символ импорта с ведущим двоеточием, как в изе Р05ІХ 
":зуз маії |“. Ключами являются теги с двоеточиями без ведущего двоето- 
чия. Значения должны быть ссылками на массивы, содержащие символы, 
которые следует импортировать, когда запрашивается тег с двоеточием, и все 
эти значения должны также присутствовать в @ЕХРОНТ или @ЕхРОНТ_ОК. Пере- 
менная не является исключением для изе $1г1ст. См. главу 11. 


$ЕХТЕМОЕС_0$_ЕВАОВ 


$`Е [АПЛ Информация об ошибке, специфичная для используемой операцион- 
ной системы. В ОМХ переменная $Е идентична $! ($05_ЕВВОВ), но это не так 
в 05/2, УМ$, системах М1сгозой и в МасРег1. Специфическую информацию 
можно найти в документации по конкретной версии Ре! для той или иной 
платформы. Предостережения в описании $! обычно относятся и к $`Е. (Мне- 
моника: дополнительное толкование ошибок.) 


@Е [РКС] Массив полей расщепленной строки ввода, если задан ключ команд- 
ной строки -а. Если ключ -а отсутствует, массив не имеет специального зна- 
чения (и фактически представляет собой лишь бпаіп::Е, а не массив во всех 
пакетах). 


%ЕТЕТО$ 
[ХХХ,РКС] Этот хеш предназначен для внутреннего использования в прагме 
изе 11е19$ для определения текущих допустимых полей в хеше объекта. 
Ғогтаї_Рогтғееа НАМОЕЕ ЕХРА 
ФҒОКМАТ_ РОВМЕЕЕО 


$71 [АЦ То, что неявно выводит функция мгіїе для подачи листа перед выводом 
заголовка формы. Значение по умолчанию равно "\!". 


Ғогпаї_1іпеѕ_Іеғїі НАМОЕЕ ЕХРЯ 


[ЕНА] Число строк, оставшихся на странице выбранного в данный момент 
дескриптора файла вывода, для использования в объявлении ѓогпаї и функ- 
ции мгіїе. (Мнемоника: строк_на_странице - строк_напечатано.) 
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Ғогтаї_1іпеѕ рег раде НАМОЕЕ ЕХРА 
ФҒОВМАТ 1 ТМЕЅ РЕЯ РАСЕ 


$= [ЕНА] Текущая длина страницы (количество строк для печати), соответст- 
вующая выбранному в данный момент дескриптору файла вывода, для ис- 
пользования в ѓогпаї и функции мгіїе. По умолчанию равна 60. (Мнемоника: 
символ «=» состоит из горизонтальных линий.) 


Ғогтаї 1іпе бгеак_сһагас+егѕ НАМОЁЕ ЕХРА 
ФЕОАМАТ 1 ІМЕ_ ВВЕАК_СНАВАСТЕВЅ 


$: [АШ] Текущий набор символов, после которых строка может быть разбита 
для заполнения полей продолжения (начинающихся с ^) в формате. Значение 
по умолчанию " \п-", что означает разбиение по пробельным символам 
и дефисам. (Мнемоника: со]оп! (двоеточие) является техническим термином, 
означающим в поэзии часть строчки. Теперь нужно только запомнить мнемо- 
нику...) 


Тогтаї пате НАМОЕЕ ЕХРЯ 
фЕОВМАТ_МАМЕ 


$ [ЕНАЈ Имя текущего формата отчета для текущего дескриптора выходного 
файла. Значением по умолчанию является имя дескриптора файла. (Мнемо- 
ника: поворот после $^.) 


Ғогпа+ раде _питрег НАМОЁЕ ЕХРВ 
ФЕОАМАТ РАСЕ МОМВЕВ 


$% [ЕНА] Номер текущей страницы для текущего дескриптора выходного фай- 
ла, для использования с Ѓогпаї и мгіїе. (Мнемоника: % служит регистром но- 
мера страницы в ѓгоѓ (1). Как, вы не знаете, что такое ѓо?) 


Тогтат_фор_пате НАМОЁЕ ЕХРА 
ФЕОВМАТ_ТОР_МАМЕ 


$ [ЕНА] Имя текущего формата верхнего колонтитула для текущего дескрип- 
тора выходного файла. По умолчанию представляет имя дескриптора файла 
с окончанием ТОР. (Мнемоника: указывает на верх страницы.) 


$`н [МОТ/ГЕХ] Эта переменная содержит разряды статуса для компилятора Рей] 
(известные также как «подсказки», һіпіѕ), имеющие лексическую область 
видимости. Эта переменная предназначена исключительно для внутреннего 
использования. Ее наличие, действие и содержимое могут изменяться без 
уведомления. Тот, кто до нее дотронется, несомненно, умрет ужасной смер- 
тью от какой-нибудь отвратительной тропической болезни, неизвестной нау- 
ке. (Мнемоника: знаем, но не скажем.) 


Н [МОТГЕХ] Хеш %^Н обеспечивает такую же семантику лексической видимо- 
сти, как и $`Н, что делает его полезным для реализации прагм с лексической 
областью видимости. Прочтите зловещие предупреждения в описании $`Н 
и добавьте к ним тот факт, что данная переменная все еще является экспери- 
ментальной. 


1 Колон (греч. КоЇоп) – ритмическая единица прозаической речи. — Прим. ред. 
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ІМС 


[АС Хеш с именами всех файлов, загруженных посредством 00 ЕЛЕ, геди1ге 
или изе. Ключами служат имена файлов, а значениями — фактические место- 
нахождения файлов. Оператор гедиіге использует этот массив, чтобы опреде- 
лить, не загружен ли уже указанный файл. Например: 


х рег1 -М МР: :$1тр1е -1е ‘ргіпі $ІМС{“1МР/5ітр1е.рт"} ° 
/орї/рег1/5.6.0/110/51іїе_рег1/1МР/Ѕітр1е. рт 


ТМС 
[АШ] Массив, содержащий список каталогов, где йо РІ Е, геди1ге или изе мо- 
гут искать модули Рен. Первоначально состоит из аргументов ключа команд- 
ной строки -Г и каталогов в переменной среды РЕЋІ511В, за которыми следуют 
библиотеки Ре! по умолчанию, например: 


/иѕг/1оса1/1160/рег15/511е рег1/5. 14. 2/даги1п-21еме1 
/иѕг/1оса1/116/рег15/ѕііє рег1/5. 14. 2 
/иѕг/1оса1/11р/рег15/5. 14. 2/дагміп-21еме1 
/иѕг/1оса1/110/рег15/5. 14.2 
/оѕг/1оса1/1ір/рег15/5іїе _рег1 


за которыми следует символ «.», представляющий текущий каталог. Чтобы 
изменить этот список в программе, включите прагму џѕе 110, которая не 
только модифицирует переменную на этапе компиляции, но также добавля- 
ет некоторые каталоги, специфические для платформы (например, содержа- 
щие библиотеки совместного доступа, используемые модулями Х8): 


иѕе 110 "/тураћ/116а1іг/": 
изе Ѕотемоа; 


ФТМРЕАСЕ_ЕОТТ 


$`Г [АШ] Текущее значение расширения для редактирования по месту. Отклю- 
чить редактирование по месту можно, назначив переменной значение ипдет. 
К этой переменной можно обратиться из программы для получения такого 
же результата, как при использовании ключа -і. Например, чтобы получить 
эквивалент команды 


$ рег] -1.0г19 -ре 'ѕ/Гѓоо/баг/0` * с 
можно выполнить в программе такой код: 


1осаї $71 = “.огіс̧“; 
1оса1 @АВбУ = 9100("*.с”) 
мһіЈе (<>) { 

5/#оо/раг/9; 

ргіпї; 


(Мнемоника: значение ключа -1.} 
$ТМРОТ _ІМЕ_ МОМВЕВ 


$. [ГАШ] Номер текущей записи (обычно номер строки) последнего дескриптора 
файла, из которого производилось чтение (или для которого вызывалась 
функция ѕеек или {е11). Значение может отличаться от фактического физиче- 
ского номера строки в файле - в зависимости от того, как определено текущее 
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понятие «строки» (см. описание $/ ($ТМРИТ_ВЕСОВО_ЗЕРАВАТОН)). Явное закрытие 
дескриптора файла сбрасывает номер строки. Поскольку <> не выполняет за- 
крытие явно, строки имеют сквозную нумерацию в файлах АНб\ (но см. при- 
меры для ео?). Локализация $. локализует и представление Рег1 о «последнем 
дескрипторе файла, из которого производилось чтение». (Мнемоника: во мно- 
гих программах «.» используется в качестве номера текущей строки.) 


$ТМРИТ_ВЕСОВО_ЗЕРАВАТОВ 


$/ 


[АТ Разделитель входных записей, по умолчанию - символ перевода стро- 
ки, который применяется функциями геад]1те, оператором <ҒН> и функцией 
сһотр. Действует подобно переменной А5 в ашЁ и при установке в нулевую 
строку рассматривает одну или более пустых строк как признак конца запи- 
си. (Пустая строка при этом не должна содержать пробелы или табуляции.) 
Переменной можно присвоить строку из нескольких символов, и тогда разде- 
ление будет выполняться по многосимвольному разделителю, но нельзя при- 
своить шаблон — должен же ашё быть в чем-то лучше. 


Заметьте, что установка $/ в "\п\п” имеет смысл, несколько отличающийся от 
установки в “", если файл содержит пустые строки, располагающиеся под- 
ряд. При установке этой переменной в значение “” две или более последова- 
тельные пустые строки рассматриваются как одна пустая строка. Установка 
в "\п\п” означает, что Рей будет рассматривать третий перевод строки как 
принадлежащий новому абзацу. 

Если сделать $/ неопределенной, очередная операция ввода строки «прогло- 
тит» остаток файла как одну скалярную величину: 


ипдег $/, # включить режим чтения файла целиком 
ф = <ЕЊ; # теперь весь файл в переменной 
зИ\п[ \]+/ /9; # выполнить свертку отступов в строках 


Если конструкция мћі1е (<>) применяется для доступа к дескриптору АНб\ при 
неопределенном значении $/, каждая операция чтения буде получалжь оче- 
редной файл: 


ипоег $/; 
мћі1е (<>) { в $_ содержит очередной файл целиком 


} 


Выше была использована ипіеѓ, но безопаснее сделать $/ неопределенной с по- 
мощью 10са1: 


{ 
10са1 $/; 
$ = <Р; 
} 


Присваивание переменной $/ ссылки на целое число, скаляр, содержащий 
целое число, или скаляр, который можно преобразовать в целое число, заста- 
вит операции геад1іпе и <ЕН> читать записи фиксированной длины (при этом 
максимальным размером записи будет это целое число) вместо записей пере- 
менной длины, оканчивающихся указанной строкой. Поэтому код: 


$/ = \32768: в или \"32768" или \$ѕса1аг маг сопіаіпіпо_32768 
ореп(ЕТЕЕ, $туҒі1е); 
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$гесога = <ЕГЕЕ>, 


прочитает запись не длиннее 32768 байт из дескриптора ЁГЕ. Если чтение вы- 
полняется не из файла, ориентированного на записи (или операционная сис- 
тема не поддерживает файлы, ориентированные на записи), то, вероятно, при 
каждом чтении вы будете получать файл целиком. Если запись длиннее уста- 
новленного размера, вы получите запись частями. Режим записей можно сме- 
шивать с построчным режимом только в системах, где стандартный ввод/вы- 
вод предоставляет функцию геа4(3); УМ является известным исключением, 


Вызов сһопр, когда $/ активизирует режим записей или не определена, не 
оказывает эффекта. См. также ключи командной строки -0 (цифра) и -/ (бук- 
ва) в главе 17. (Мнемоника: / используется в качестве разделителя строк при 
цитировании стихотворений.) 


@ТЗА 


[РКС] Этот массив содержит имена других пакетов, которые нужно просмат- 
ривать, если вызываемый метод отсутствует в текущем пакете. Это значит, 
что он содержит базовые классы пакета. Неявно устанавливается директи- 
вой разе. Не исключается из сообщений $1г1с1. См. главу 12. 


@1АЗТ_МАТСН_ЕМО 


@+ [РУМ,ВО] Данный массив хранит смещения конечных координат последних 
успешных вложенных соответствий в активной в данный момент динамиче- 
ской области видимости. $+[0] представляет смещение конца всего соответст- 
вия. Это же значение возвращает функция роѕ для переменной, для которой 
проводилось сопоставление. (Говоря «смещение конца», мы в действительно- 
сти имеем в виду смещение первого символа, следующего за концом найденно- 
го соответствия, что позволяет вычислить смещения начал из смещений кон: 
цов и получить длину.) п-й элемент этого массива содержит смещение п 'го 
вложенного соответствия, поэтому $+[1] является смещением конца для $1, 
$+[2] – смещением конца для $2 и т.д. С помощью $#+ можно определить коли- 
чество подгрупп в последнем успешном сопоставлении. См. также @- (@1АЅТ_ 
МАТСН_5ТАВТ). 


После успешного поиска в некоторой переменной $\а': 

• $’ то же самое, что ѕирѕіг($уаг, 0, $-[01) 

• $& то же самое, что ѕибѕіг(Фуаг, $-[0], $+[0] - %-[0]) 

• $’ то же самое, что ѕибѕіг($уаг, $+[0]) 

• $1 то же самое, что ѕирѕїг($уаг, $-[1], 9+1] - $-[11) 

е $2 то же самое, что ѕибѕіг($уаг. $-[2]. $+[2] - $-[2]) 

• $3 то же самое, что ѕирѕіг($уаг, $-[3], $+[3] - $-[3]) ит.д. 
@АЅТ МАТСН_ТАВТ 


@- [РУМ,ВО] Данный массив содержит смещения начал последних успешных 
вложенных соответствий в активной в данный момент динамической облас- 
ти видимости. $-[0] является смещением начала всего соответствия. п-й эле- 
мент этого массива содержит смещение п-го вложенного соответствия, поэто- 
му $-[1] равно смещению начала для $1, $-[2] – смещению начала для $2, 
ит.д. С помощью $#- можно определить количество подгрупп в последнем ус- 
пешном сопоставлении. См. также @+ (61 А5Т_МАТСН_ЕМО). 
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$1 АЅТ_РАВЕМ№_МАТСН 


$+ 


ҮМ, КО] Эта переменная возвращает последнее вложенное соответствие 
в скобках для последнего найденного шаблона в текущей динамической об- 
ласти видимости. Это полезно, когда неизвестно (или безразлично), с каким 
шаблоном из группы альтернативных шаблонов было найденс соответствие. 
(Мнемоника: будь решительным и смотри вперед.) Пример: 


$геу = $+ 11 /Мегѕіоп: (. *) [Вем1$10п: (.*)/; 


%1 АЗТ_РАНЕМ_МАТСН 


+ 


[рҮМ№“,К0] Как и %-, эта переменная обеспечивает доступ к именоьанным со- 
храняющим группам в последнем успешном поиске по шаблону в текущей 
активной динамической области видимости. Ключами этого хеша служат 
имена сохраняющих групп, а значениями – строки соответствий с группами 
или, если есть несколько групп с одинаковым именем, строка соответствия 
последней группе. Если требуется получить соответствия всем одноименным 
группам, используйте %-. 


Не смешивайте вызовы еасй с этим хешем и поиск по шаблону в цикле, иначе 
вы будете получать противоречивые результаты. 


Если вам не нравится форма записи $+{ЛАМЕ}, используйте стандартный мо- 
дуль Тіе::Наѕћ::МатедСарїџге, чтобы создать свой псевдоним для переменной $4. 


Ф А5Т ВЕСЕХР СОрЕ ВЕИТ 
$`н [ҮМ] Эта переменная содержит результат последнего выполнения фрагмен- 


та кода в конструкции (?{ С00Е }) в ходе успешного поиска по шаблону. $ 
позволяет выполнить код и запомнить результат выполнения этого кода для 
использования далее в шаблоне или после сопоставления. 


При обработке шаблона механизм регулярных выражений может встретить 
несколько выражений (?{ С00Е }). Поэтому механизм запоминает каждое 
значение $78 и при необходимости осуществить возврат восстанавливает со- 
ответствующее прежнее значение $`Н. Иными словами, $` имеет в шаблоне 
динамическую область видимости, аналогично $1 и прочим переменным. 


Поэтому $`В представляет не просто результат выполнения последнего фраг- 
мента кода в шаблоне. Это результат выполнения последнего фрагмента кода 
на пути к успешному сопоставлению. Иначе говоря, в случае неудачи будет 
восстановлено прежнее значение $. 


Если шаблон (?{ СОВЕ }) действует непосредственно как условие подшаблона 
(?(СОМО) ТЕТВИЕТЕРАЕЗЕ), значение $ не устанавливается. 


Ф А5Т ЗУВМАТСН_ВЕЗИЕТ 
$`м [РУМ,ВО] Текст соответствия последней закрытой группе (закрывающая 


скобка которой находится правее всех остальных), в последней успешной 
операции поиска по шаблону. 


В основном используется внутри блоков (?{...}) для проверки только что сов- 
павшего текста. Например, чтобы сохранить текст соответствия в перемен- 
ной (в дополнение к переменным $1, $2 и другим), замените (...) на: 


(2: (РАТТЕНМ)(9{ $уаг = $№ })) 


Это избавит от необходимости выяснять, какой паре скобок соответствует 
искомое соответствие. 
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Данная переменная появилась в Рег! версии у5.8. 
Мнемоника: (возможно) вложенные! скобки, закрытые самыми последними. 

$1 ТЗТ_ЗЕРАВАТОВ 

$” [АШУ]Когда массив или его срез интерполируются в строке в двойных кавыч- 
ках (или аналогичной конструкции), эта переменная задает строку-раздели- 
тель для отдельных элементов. По умолчанию равна пробелу. (Мнемоника: 
надо думать, очевидная.) 

$М [АЦ] По умолчанию ошибка нехватки памяти не перехватывается. Однако 
если при компиляции рей! была зарезервирована возможность применения 
ФМ, ей можно отвести роль аварийного пула памяти. Если Рег! скомпилиро- 
ван с -ОРЕВГ ЕМЕЕВСЕМСУ ВЕК, а также использует Регі-реализацию 
па110с, операция 


$ М = "^а" х (1 << 16); 


выделит буфер объемом в 64 килобайта для аварийного использования. 
О том, как включить этот режим, читайте в файле ПУЗТА Г.Л, в каталоге дист- 
рибутива исходного кода Регі. Чтобы не поощрять случайное применение 
этой функции, для данной переменной не определено длинное имя в ие 
Епд11$ћ (а какая мнемоника, мы вам не скажем). 


ФМАТСН 


$& [ШҮМ,КОЈ] Строка, найденная при последнем успешном поиске по шаблону 
в активной на данный момент динамической области видимости. (Мнемони- 
ка: как & в некоторых редакторах.) 
Использование этой переменной в программе отрицательно сказывается на 
производительности всех операций сопоставления с регулярными выраже- 
ниями. Чтобы избежать этого, те же самые подстроки можно извлекать с по- 
мощью ё-. Начиная с версии у5.10 появилась возможность использовать флаг 
/рв регулярных выражениях, что дает нам переменную ${`МАТСН}, играющую 
ту же роль для конкретной операции поиска по шаблону. 


${ИМАТСН} 


[РУМ,ВО] Действует так же, как $& ($МАТСН), но не снижает производитель 
ность. Гарантируется, что эта переменная будет содержать определенное зна: 
чение, только если шаблон скомпилирован или выполнен с модификатором /р. 


Эта переменная появилась в Регі версии у5.10. 
Ф$ОЗМАМЕ 


$0 [АБ Содержит название платформы (обычно – операционной системы), для 
которой был скомпилирован текущий исполняемый модуль регі. Дешевая 
альтернатива извлечению данной информации из модуля Сопѓід. 


$0$_ЕЯВОВ 
ФЕВАМО 


$ АШ При использовании в числовом контексте возвращает текущее значение 
последней ошибки системного вызова – и, конечно, здесь действительны все 
обычные предостережения. (Это значит, что $! может и не содержать нужной 
вам информации, и наее значение можно полагаться только в случае, если она 


1 Отанглийского слова Мефей, обозначающего вложенность. — Прим. лит. ред. 
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содержит особое значение, однозначно указывающее на системную ошибку.) 
В строковом контексте $! возвращает соответствующее сообщение о систем- 
ной ошибке. Можно присвоить $! свой номер ошибки, чтобы $! вернула стро- 
ку, соответствующую этой ошибке, или чтобы установить значение выхода 
для 01е. См. также описание модуля Еггпо. (Мнемоника: что там грохнулось?) 


%05 ЕААОВ 
%ЕВВМО 


У! 


[АШ] Каждый элемент %! имеет истинное значение, только если переменная 
$! установлена в значение этого элемента. Например, $! {Е№ОЕМТ} имеет истин- 
ное значение, только когда текущим значением переменной $! является зна- 
чение ЕМОЕМТ, т.е. если последней была ошибка «Мо зись ёе ог Ч1гесфогу» (нет 
такого файла или каталога) (или ее эквивалент: не все операционные систе- 
мы и не все языки программирования дают именно такую ошибку). Прове- 
рить наличие того или иного ключа в конкретной системе можно с помощью 
выражения ех151$ $!{50МЕКЕУ}; получить список всех допустимых ключей 
можно с помощью %!. Дополнительную информацию вы найдете в докумен- 
тации модуля Еггпо, а также в описании переменной $! выше. 


Эта переменная появилась в Рег] версии у5.005. 


аитоғ1иѕћ НАМОЕЕ ЕХРВ 
ФАИТОРЦИЗН 


$ 


[ЕНАЈ Будучи установленной в истинное значение, вызывает очистку буфера 
после каждой команды ргіпї, ргіпіѓ и игЦе для выбранного в данный момент 
дескриптора файла вывода. (Мы называем это буферизацией команд. Вопре- 
ки распространенному мнению, установка этой переменной не отключает бу- 
феризацию.) Значением по умолчанию является «ложь». что для многих сис- 
тем означает, что 5Т000Т будет буферизоваться построчно, если вывод проис- 
ходит на терминал, и блочно - в ином случае, даже для каналов и сокетов. 
Установка этой переменной полезна, если вывод производится в канал, на- 
пример, если запускается сценарий Рег] под г5/(1), и требуется наблюдать за 
выводом в реальном времени. Если выходной буфер выбранного в данный мо- 
мент дескриптора файла содержит еще не выведенные данные, в момент, ко- 
гда эта переменная получит истинное значение, в качестве побочного эффек- 
та этот буфер будет немедленно «вытолкнут». Примеры управления буфери- 
зацией для дескрипторов файлов, отличных от 510007, вы найдете в описании 
формы ѕе1есї с одним аргументом. (Мнемоника: когда нужно, чтобы каналы 
качали «от души».) 


Эта переменная не влияет на буферизацию ввода, о которой сказано в описа- 
нии функции деїс в главе 27 или примере для модуля РОЅІХ. 


ФОИТРИТ_ЕТЕЕГО_ЗЕРАВАТОВ 


$, 


[АГ Разделитель полей вывода для ргіпі. Обычно ргіпї просто выводит ука- 
занный список элементов, не разделяя их. Устанавливайте эту переменнук, 
так же, как переменную аш 0Е5 для задания символов, выводимых между по- 
лями. (Мнемоника: то, что выводится, когда в операторе ргігпї есть запятая (,).) 


фОЦТРИТ_ВЕСОНО_ЗЕРАВАТОВ 
$ [АГ Разделитель выходных записей (фактически завершающий символ) 


для ргіпі. Обычно ргіпі просто выводит перечисленные через запятую поля 
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без символа перевода строки или разделителя записей в конце. Присваивай 
те этой переменной последовательность символов для вывода в конце записи, 
при каждом вызове ргіпї, по аналогии с переменной ашё 085. (Мнемоника: $\ 
устанавливается вместо “\п’, добавляемого в конце вывода. Кроме того, она 
похожа на /, но это то, что мы получаем «обратно» от Рег1.) См. также описа- 
ние ключа командной строки -[ (от «Ппе») в главе 17. 


ФОМЕВІ ОАР 
ПМОТ,РКС] Элементы этого хеша устанавливаются директивой иѕе омег1оай 
с целью реализации перегрузки операторов для объектов класса текущего 
пакета. См. главу 18. 

ФРЕВЕОВ 

$°Р [МОТ, АТ Внутренняя переменная для включения отладчика Регі (регі -а). 

ФРЕВІ_МЕВЅТОМ 

$`У [АШ Номер версии, подверсии и ревизии интерпретатора Ре!1, Эта перемен- 
ная появилась в Регі версии у5.6.0 – в более ранних версиях будет иметь неоп- 
ределенное значение. До версии у5.10.0 переменная $ содержала У-строку. 


$ \ можно использовать для определения версии интерпретатора Регі, под 
управлением которого выполняется сценарий. Например: 


магп "Наѕћеѕ пої гапдот12еа!\п” џп1еѕѕ $^У && $^\ дї У5. 8; 


Преобразовать значение $^\ в строку можно с помощью спецификатора фор- 
мата "жуд" функции ѕргіпїї: 


ргіпЕЁ “уегѕіоп 1$ м%муй\п”, $^У; # Версия Рег1 
В более новых версиях Рег! это делается автоматически: 


$ рег1 -Е ‘зау $^\' 
\5.14.0 


$ рег1 -Е ѕау $^\ > 5.10.1 
И 


Читайте в описании изе УЕВ$ТОМ и гедиіге УЕВЗТОМ о том, как удобнее завер- 
шить работу, если используемый интерпретатор Рег! старше, чем вы рассчи- 
тывали. В описании $] содержится информация о том, как изначально пред- 
ставлялась версия Регі. 


Мнемоника: используйте ^\ для управления версиями. 
$РОЗТМАТСН 


$ [РУМ,ВО] Строка, следующая за тем, что былс найдено в последней удачной 
операции поиска по шаблону в активной на данный момент динамической 
области видимости. (Мнемоника: часто следует за цитируемой строкой.) 
Пример: 


$_ = "абсдеғоһі” 
/де?/; 
ргіпі “$`:$&:$°\п”; # выведет арс: деЁ: оп 


Из-за динамической области видимости Рег! не знает, каким шаблонам по- 
требуется сохранять свои результаты в этих переменных, поэтому упомина- 
ние $` или $ где-либо в программе снижает производительность всех опера- 
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ций поиска по шаблону в программе. В небольших программах это не вызы- 
вает особых проблем, но при написании кода модуля, предназначенного для 
повторного использования, применения этой пары лучше избегать. Приве- 
денный выше пример можно переделать, чтобы избежать урона общей про- 
изводительности: 


$ = “арсдеғоһі”; 
(0.7) (деғ)(. *)/5; В /з на случай, если $1 содержит перевод строки 
ргіпі "$1.$2:$3\п"; # выведет абс: де?:оһі 


${ГРОЗТМАТСН} 


[РУМ,ВО] Подобна переменной $' (ФРОЗТМАТСН), но не снижает производитель- 
ность. Гарантируется, что эта переменная будет содержать определенное зна- 
чение, только если шаблон скомпилирован или выполнен с модификатором /р. 


Эта переменная появилась в Регі версии у5.10. 


ФРВЕМАТСН 


$. 


[РУМ,Во] Строка, предшествующая тому, что было найдено в последней 
удачной операции поиска по шаблону в активной на данный момент динами- 
ческой области видимости. (Мнемоника: часто предшествует цитируемой 
строке.) См. выше замечание о производительности для $ . 


${ПРАЕМАТСН} 


[ОҮМ,КО] Подобна переменной $` (ФРАЕМАТСН), но не снижает производитель- 
ность. Гарантируется, что эта переменная будет содержать определенное зна- 
чение, только если шаблон скомпилироваин или выполнен с модификатором /р. 


Эта переменная появилась в Реті версии У5.10. 


$РАОСЕЅ9 10 


$$ 


[А11] Номер процесса (РПО) Рей, выполняющего данный сценарий. Эта пере- 
менная автоматически обновляется при вызове ѓогк. На практике можно да- 
же установить $$ самостоятельно; при этом, однако, РПО процесса не изме- 
нится. Это ловкий фокус. (Мнемоника: та же, что в различных интерпретато- 
рах команд.) 

Будьте осторожны с $$; в некоторых случаях она может быть ложно истолко- 


вана как разыменование: $$а1рћапит. В такой ситуации пишите ${$}а1рпапит, 
чтобы отличить ее от ${$а1рпапип}. 


$РАОСВАМ_МАМЕ 


$0 


[АПЛ Содержит имя файла выполняющегося сценария Рет]. Присваивание 
переменной $0 представляет собой волшебство: оно пытается изменить об- 
ласть аргументов, о которой обычно сообщает программа р5(1). Это полезнее 
применять для индикации состояния, чем для сокрытия выполняемой про- 
граммы. Но это работает не на всех системах. (Мнемоника: та же, что в з, 
Езй, Баѕћ ит.д.) 


В многопоточных сценариях Ре! координирует работу потоков выполнения 
так, что любой из них может изменять свою копию $0, и эти изменения дос- 
тупны команде рѕ (предполагается, что система позволяет это). Имейте в ви- 
ду, что с точки зрения других потоков выполнения значение $0 не изменяет- 
ся, поскольку эти потоки имеют собственные копии переменной. 


Если программа запущена с ключом -е или -Ё, $0 будет содержать строку "-е. 
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$ВЕАЕ_СВОУР_ТО 


$ 


[АТ] Реальный Г) группы (СІР) данного процесса. Если платформа поддер- 
живает одновременное членство в нескольких группах, $( хранит разделен- 
ный пробелами список ваших групп. Первое число — это значение, которое 
возвращает дел а(2), а последующие представляют собой числа, возвращае- 
мые детгоирз(2), одно из которых может совпадать с первым числом. 


Однако для установки реального СТО через присваивание $( следует исполь- 
зовать единственное число. Поэтому значение, которое дает $(, не должно 
присваиваться обратно $( без принудительного преобразования его в число, 
например, путем сложения с нулем. Это связано с тем, что реальная группа 
может быть только одна. См. описание $) (ФЕРҒЕСТІМЕ САООР 10), позволяющей 
устанавливать несколько текущих групп. 


(Мнемоника: круглые скобки предназначены для группировки объектов. Ре- 
альный СО ~ это группа, которую мы покинули (е]{!), выполняя ѕеісій.) 


$ВЕАЕ_ИЗЕВ_ТО 


$< [АШЈРеальный І пользователя (1710) данного процесса, как он возвращает - 
ся системным вызовом вениа(2). Можно ли его изменить и как, зависит от 
особенностей реализации системы — см. примеры в $> (ФЕРЕЕСТТУЕ ЏЅЕВ_І0). 
(Мнемоника: это ЛІР, от которого мы пришли, выполыян ѕеішіа.) 

%510 


1 


[АГ] Хеш, используемый для установки обработчиков различных сигналов. 
(См. раздел «Сигналы» главы 15.) Например: 


зуб һапд1ег { 
ту $519 = $Н1РЕ; # 1-й аргумент является именем сигнала 
ѕуѕигіе ЗТОЕВВ, ‘Перехват 516$519 -- завершение работы\п”; 
# Избегайте использования стандартного ввода/вывода 
# в асинхронных обработчиках, чтобы избежать дампов памяти 
# (Даже конкатенация строк опасна. ) 


с1оѕе 106; 6 Обращается к стандартному 1/0. поэтому может 
# завершиться аварийно! 
ех1ї 1 # Но так как мы выходим, можно попробовать. 


} 


$510{ІМТ} = \&папа1ег; 


$5т6{00ТТ} = \&һапа1ег; 
$516{1МТ} = "БЕРАУСТ"; # восстановить действие по умолчанию 
$5Т0{00ІТ)} = "ІОМОВЕ"; # игнорировать $16001Т 


Хеш %516 содержит неопределенные значения, соответствующие сигналам, 
для которых не установлены обработчики. Обработчик можно задать как 
ссылку на подпрограмму или строку. Строковое значение, не являющееся 
одним из специальных действий “ОЕРАИТ” или “ТСМОВЕ", представляет собой 
имя функции, которая, если ее имя не квалифицировано пакетом, считается 
принадлежащей к пакету паіп. Вот еще несколько примеров: 


Имеется в виду левая скобка. В английском языке слово «левая» и глагол «покинуть» 
в форме прошедшего времени пишутся одинаково: Іей. —- Прим. ред. 
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$$16{РТРЕ} 
$$16{РТРЕ} 


"Р1итрег"; # годится, предполагает таіп: : Р1итбег 
\8Р10трег; # отлично, использовать Р1итбег из текущего пакета 


С помощью хеша %516 можно также установить некоторые внутренние обра- 
ботчики. Подпрограмма, на которую указывает $516{__МАВМ__}, вызывается 
перед тем, как будет выведено предупреждение. Сообщение передается в пер- 
вом аргументе. Существование обработчика _ \АВМ__ вызывает подавление 
обычного вывода предупреждений на ЭТОЕВВ. Такой обработчик можно ис- 
пользовать для сохранения предупреждений в переменной или чтобы сде- 
лать предупреждения фатальными ошибками, например: 


1оса1 $$164_ МАНМ__} = хир { 91е $ [0] }, 
еуа1 $ргодб1е; 


Это аналогично высказыванию 


изе магпіпоѕ ам/РАТАЕ а11/; 
еуа1 $ргоддіе; 


за исключением того, что в первом случае область видимости динамическая, 
а во втором – лексическая. 


Подпрограмма, на которую указывает $516{__ПТЕ__}, превращает исключе- 
ние-лягушку в исключение-принцессу с помощью волшебного поцелуя, что 
часто не работает. Наилучшее применение этого обработчика – некая завер- 
шающая обработка перед выходом для умирающей программы, которая 
должна скончаться от необработанного исключения. От смерти это не спасет, 
но еще немного подышать получится. 


Сообщение исключительной ситуации передается в первом аргументе. При 
возврате из обработчика __01Е__ дальнейшая обработка исключения проис- 
ходит так, как если бы обработчика не было, если только подпрограмма-об- 
работчик не завершится через 9010, выход из цикла или іе. Во время вызова 
обработчик __01Е__ явным образом отключается, чтобы была возможность 
вызвать настоящий 0іе из обработчика __ОТЕ__. (Если его не отключить, то 
обработчик будет рекурсивно вызывать себя до бесконечности.) Обработчик 
для $516{_ ИАЯМ__} действует аналогично. 


Устанавливать $516{__ОТЕ__} нужно только в основной программе, но не в мо- 
дулях. Это связано с тем, что в настоящее время даже перехватываемые ис- 
ключения все же запускают обработчик $516{__ОТЕ__}. Делать это настоятель- 
но не рекомендуется, поскольку обработчик, может нарушить работу невин- 
ных модулей, не ожидающих, что предполагаемое ими поведение в исклю- 
чительных ситуациях таинственным образом изменитсн. Используйте эту 
возможность только в качестве последнего средства, и, если приходится это 
делать, всегда ставьте впереди 10са1, чтобы сократить опасный период. 


Если вы привыкли к языкам программирования, которые реагируют на не- 
обработанные исключения заполнением экрана стеком вызовов, то можете 
заставить Рет| делать то же самое. поместив следующие строки в модуль па: п 
своей программы: 


изе Сагр; 
$516{_ ОТЕ__} = зи6 { сопѓеѕѕ “$0: ОМСАОСНТ ЕХСЕРТТОМ: @_^ 


ип1еѕѕ $$ }; 
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Не пытайтесь построить на этой возможности механизм обработки исключе- 
ний. Вместо этого для перехвата исключений используйте еуа1 {}. Например, 
чем использовать обработчик __ПТЕ__, оформите основную программу в виде 
подпрограммы и оберните ее стандартным обработчиком исключений — обыч- 
ным еуа1 ВЕОСК 
иѕе Сагр; 
еға1 { 
Типстіоп_һаї_доеѕ_ емегуіһіпо( ); 
іб 
} | сопғеѕѕ "$0 Саџидћї опехрестеа ехсертіоп: $0", 


ЭТОЕВВ 


[АГ Специальный дескриптор файла для стандартного устройства вывода 
ошибок во всех пакетах. 


УТОК 


[АГ Специальный дескриптор файла для стандартного устройства ввода во 
всех пакетах. 


5Т00ОТ 


[А1] Специальный дескриптор файла для стандартного устройства вывода 
во всех пакетах. 


$50В5СВІРТ _ЗЕРАВАТОВ 
$; [АБ Разделитель индексов для эмуляции многомерных хешей. Если вы 
ссылаетесь на элемент хеша как 
$Гоо{Фа, $6, $с} 
то в действительности это значит: 
Фғоо{јоіп($;, Фа. $6, $с)} 
Но не пишите: 
@Роо{Фа, $6,$с} # срез, обратите внимание на @ 
что означает: 
($Гоо{$а}, $Роо{$6} , $Р00{$с} ) 


Значением по умолчанию является "\034" — то же, что ЗИВЗЕР в ашЁ. Обратите 
внимание, что, если в ключах содержатся двоичные данные, то безопасного 
значения для $; может не найтись. (Мнемоника: запятая - разделитель син- 
таксических индексов - это половина точки с запятой. Коряво, конечно, но 
$, уже занята для более важных задач.) 


Хотя мы не объявили эту функцию устаревшей, сейчас лучше использовать 
«настоящие» многомерные хеши, т.е. $#00{$а) {$6} {$с}, вместо $Ғоо{$а, $0,$с). 
Однако может оказаться, что поддельные хеши легче сортируются и проще 
в использовании в качестве ОВМ-файлов. 


$5У5ТЕМ_ЕО_МАХ 
$Е [АШ] Максимальный «системный» номер файла, обычно 2. Системные номе- 


ра файлов передаются новым программам во время ехес, а номера с ббльши: 
ми значениями - нет. Кроме того, во время выполнения ореп системные номера 
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файлов сохраняются, даже если вызов этой функции завершается неудачей. 
(Обычные указатели файлов закрываются перед попыткой выполнения ореп 
и остаются закрытыми при ее отказе.) Обратите внимание, что статус де- 
скриптора файла в отношении закрытия при ехес определяется согласно зна- 
чению $`Е во время выполнения ореп, а не во время выполнения ехес. Этого 
можно избежать, сначала временно присвоив $`Ё заведомо большое значение: 


{ 

10са1 $^Е = 10000; 

раре(НТТНЕВ, ТНТТНЕВ) ог діе "сап'ї ріре: $!" 
} 


${ТАТМТ} 


[АЫ.,ВО] Эта доступная только для чтения переменная отражает состояние 
режима проверки меченых данных: включено, выключено или простой вы- 
вод предупреждений: 


Режим проверки меченых данных выключен (по умолчанию). 


1 | Режим проверки меченых данных включен, обычно из-за того, что программа 
была запущена с ключом -Т. 
-1 | Только выводить предупреждения, включается ключами командной строки -# 


и -ТО. 


Эта переменная появилась в Ре!| версии у5.8. 

${7ОМІСОрЕ} 
[ХХХ,АШ] Эта переменная отражает некоторые внутренние настройки Юни- 
кода в Регі. Ей можно присвоить числовое значение на этапе запуска Ре! клю- 
чом командной строки -С или посредстьом переменной среды РЕНІ _ОМІСОрЕ; 
после этого она будет доступна только для чтения. 


Эта переменная появилась в Регі версии У5.8.2. 
${ПИТЕВСАСНЕ} 


[МОТ, АШ Ввутренняя переменная, управляющая состоянием внутреннего 
механизма кэширования смещения в ОТЕ-8: 


Включен (по умолчанию). 


Выключен. 


Для отладки механизма кэширования посредством сравнения всех результатов 
с линейным сканированием и вывода сообщений обо всех несоответствиях. 
Устанавливается ключом командной строки -Са. 


Эта переменная появилась в Рен версии У5.8.9. 


${ГОТЕВЕОСАЕЕ} 


[МОТ, АШ Указывает, была ли определена настройка кодировки ОТЕ-8 в на- 
циональных настройках системы при запуске Рег. Эта информация исполь- 
зуется Рей для перекодировки ОТЕ-8 в локальную кодировку, устанавлива- 
ется ключом командной строки -СГ. 


Эта переменная появилась в Рег! версии У5.8.8. 
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$МЕВ$ТОМ 


[РКС] Обращение к этой переменной происходит, когда задается минималь- 
ная допустимая версия модуля, как в изе ЗотеМод 2.5. Если $Зотемоа: :УЕАЗТОМ 
меньше этого значения, возникает исключение. Эту переменную просматри- 
вает метод ИМТУЕНЗА(->УЕВЗТОМ, поэтому можно определить собственную функ- 
цию \/ЕВ5ТОМ в текущем пакете, если нужно что-либо иное, кроме режима по 
умолчанию. См. главу 12. 


ФИАВМІМ№О 
$^`и [АЦ] Текущее логическое значение ключа глобального предупреждения (не 


путать с глобальным потеплением, относительно которого слышно много гло- 
бальных предупреждений)! См. также описание директивы магпіпоѕ в гла- 
ве 29 и ключей командной строки -И и -Х для предупреждений с лексиче- 
ской областью видимости, на которые данная переменная не влияет. (Мнемо- 
ника: значение связано с ключом -и..) 


${МАВМТА_ВТТ$} 


[ІМОТ, АЛ Текущий набор проверок, активированных директивой изе магп- 
1103. Подробности см. в описании магпіпоѕ в главе 29. 


${^ИТОЕ_ЗУЗТЕМ_САН. $} 


[АЦ] Глобальный флаг, разрешающий всем системным вызовам, осуществ- 
ляемым Ре, использовать системный АРІ обработки широких символов 
(уіде сһагасіегѕ), если таковой имеется. Включить эту возможность можно 
из командной строки посредством ключа -С. Начальное значение обычно 0 
для совместимости с Регі версий до 5.6, но Рег может автоматически назна- 
чить этой переменной значение 1, если система предоставляет пользователь- 
ское значение по умолчанию (например, через $ЕМ\{ЕС_СТУРЕ}). Прагма буїеѕ 
всегда переопределяет действие этого флага в текущей лексической области 
видимости. 


Ф(7МІМЗ2_ 51 ОРРҮ ТАТ} 


1 


[АШ] Если эта переменная имеет истинное значение, функция ѕїаї не будет 
пытаться открыть файл при выполнении сценария в Міпдомѕ. Это означает 
невозможность определить счетчик ссылок, и атрибуты файла могут отли- 
чаться от действительных при наличии дополнительных жестких ссылок на 
файл. С другой стороны, отказ от открытия файла существенно увеличивает 
скорость выполнения, особенно для файлов на сетевых устройствах. 


Эта переменная может быть установлена в файле ѕіѓесиѕіотіге.рі с локальны- 
ми настройками Ре, чтобы обеспечить такой «неполноценный» режим ра- 
боты функции ѕїаі по умолчанию. См. описание ключа -{ в разделе «Сот- 
тапа Ѕуійсһеѕ» страницы регіғгип, где приводятся дополнительные сведения 
о локальных настройках. 


Эта переменная появилась в Ре! версии у5.10. 


Воригинале обыгрывается созвучие выражений «р1ођа! уагпіпа» и «21оБа| магии па». — 
Прим. ред. 


26 


Форматы 


Ре славится своими богатыми возможностями манипулирования текстом – имен- 
но возможности извлечения (ЕхфгасНоп) сделали его таким популярным.! Рег] так- 
же существенно упрощает форматирование строк при создании отчетов (Керогі). 
В этой главе рассматриваются функции ргіпії? и ѕргіпї?, раск и ипраск, а также 
форматы, исторические предназначавитиеся для печати форматированных отче- 
тов на принтере, но не потерявшие своей актуальности и в новом тысячелетии. 


Форматы строк 


Ре может производить форматированные строки, следуя обычным соглашени- 
ям для функций рғіліѓ и зрит{ из библиотеки языка С. Версия функции ѕргіпі? 
в Рег возвращает строку, а версия ргіпі? выводит ее в дескриптор файла, указан- 
ный явно или используемый по умолчанию: 


ѕргіпі? РОВМАТ, ІІТ 
ргіпі? АОВМАТ, ЕТ5Т 
ргіпЕ?Р ЕТЬЕНАМОЕЕ РОВМАТ, 115Т 


Функция ѕргігі? обрабатывает свои аргументы немного иначе. Первый аргумент 
она всегда интерпретирует как скаляр, даже если это массив. Вероятно, вам нуж- 
но что-то другое, поскольку в последнем случае функция интерпретирует баггау 
в скалярном контексте и просто выведет число элементов в массиве: 


пу @аггау = ( ‘Жа Жа %а`, 1, 2,3); 
ѕргіпїҒ @аггау 


Функция ргіпі? обрабатывает аргументы иначе потому, что ее первым необяза- 
тельным аргументом служит дескриптор ЕТЕЕНАМОЕЕ. 


1 Напомню, что одним из толкований акронима Рег] является: «РгасНса! Ехігасііоп апа 


Керогі гапеиаве». – Прим. перев. 
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Строка ГОВМАТ – это текст, содержащий внедренные спецификаторы полей, вместо 
которых подставляются элементы списка / 157. Это — одна из особенностей, заим- 
ствованных языком Регі из С, поэтому за описанием основных принципов можно 
смело обращаться к страницам зѕргіпі[(3) и ргіпі[8) справочного руководства сис- 


темы. 


В Ре используется собственная реализация форматирования в ѕргіпїіѓ – она 
имитирует функцию ѕргіпі? в С, но не использует ее.! Поэтому нестандартные 
расширения вашей версии ѕргіпі ИЗ) недоступны в Рег]. 


Функция ѕрг1пї? в Ре] поддерживает все распространенные спецификаторы фор- 
матов, перечисленные в табл. 26.1. 


Таблица 26.1. Спецификаторы форматов для зртт 


Специфи- 
катор 


%% 
%6 
%в 
жс 
%а 
фе 


ЖЕ 
г 
%9 
%6 


УИ 
Фп 


фо 
%р 
% 
%и 
%х 


Хх 


Значение 


Литерал знака процента 

Целое без знака в двоичной системе счисления 

Аналогично %5, но использует «В» в верхнем регистре с флагом # 
Символ с указанным кодом 

Целое со знаком, в десятичной системе счисления 


Число с десятичной запятой, в экспоненциальном представлении с префиксом 
экспоненты «е» в нижнем регистре 


Аналогично %е, но с префиксом экспоненты «Е» в верхнем регистре 
Число с десятичной запятой, в фиксированном десятичном формате 
Число с десятичной запятой. в формате Хе или Г 


Аналогично %9, но с префиксом экспоненты «Е» в верхнем регистре, если при- 
менимо 


Короткое целое или короткое целое без знака языка С, в зависимости от ком- 
пилятора, с помощью которого был собран рей 


Сохраняет число выведенных до сих пор символов сһаг в следующую перемен- 
ную в списке аргументов 


Целое без знака, в восьмеричной системе счисления 

Указатель (выводит адрес значения в шестнадцатеричной системе счисления) 
Строка неопределенной длины 

Целое без знака, в десятичной системе счисления 


Целое без знака, в шестнадцатеричной системе счисления, символами нижне- 
го регистра 


Целое без знака, в шестнадцатеричной системе счисления, символами верхне- 
го регистра 


1 За исключением вещественных чисел, но даже в этом случае допустимы только стан- 
дартные модификаторы. 
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В табл. 26.2 перечислены те же спецификаторы форматов, но сгруппированные 
по типам выводимых значений, 


Таблица 26.2. Спецификаторы форматов по типам выводимых значений 


Спецификаторы 
%0 %В а ФН Жо %р Фи 
Вещественные числа |%е ЧЕ ЖҒ %9 %6 

%с %5 


Целые числа 


Строки 


Для некоторых спецификаторов числовых форматов можно указать, как ѕргіпіїѓ 
должна интерпретировать число, не полагаясь на размеры, предложенные ком- 
пилятором. См. табл. 26.3. 


Таблица 26.3. Спецификаторы числовых преобразований в ѕргіпір 


Спецификатор Значение 

ВН сһаг или ипѕідпед спаг в языке С (\5.14 и выше) 

Ш ѕһогт или ип$19пе4 зпоге в языке С (5.14 и выше) 

ј тип іпіпах_ в языке С (у5.14 и выше, для компиляторов С99) 

1 1019 или ипѕ1дпеа 10п0 в языке С 

1,11 1019 10п9, ипѕідпеа 10пд 10по или диай в языке С (компилятор дол- 


жен поддерживать тип диай) 
ртгоіѓе с в языке С (у5 14 и выше) 


Интерпретирует строку как вектор целых чисел, выводит их как 
целые, разделяя точками или произвольной строкой, полученной 
из списка аргументов, если перед флагом стоит * 


5176 ї в языке С (у5.14 и выше) 


Для обратной (мы подразумеваем именно «направленной назад») совместимости 
Реп допускает факультативные, но широко распространенные преобразования, 
перечисленные в табл. 26.4. Мы отделили их от спецификаторов, перечисленных 
в табл. 26.1, в надежде, что вы не будете пользоваться ими. 


Таблица 26.4. Синонимы числовых преобразований для обратной совместимости. 


Спецификатор Значение 


#1 Синоним %0 

Жр Синоним %10 
%0 Синоним %1и 
%0 Синоним #10 


Синоним %Ғ 


Между % и символом преобразования допускается указывать дополнительные ат- 
рибуты, перечисленные в табл. 26.5 и управляющие интерпретацией формата: 
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Таблица 26.5. Модификаторы формата для зргт! 


Модифи- | Значение 


катор = 

пробел Пробел перед положительным числом 

+ Плюс перед положительным числом 

- Выравнивание по левому краю поля 

0 Использовать нули, а не пробелы, для выравнивания по правому краю поля 

# Использовать в качестве префикса ненулевых восьмеричных чисел "0", нену- 
левых шестнадцатеричных "0х", ненулевых двоичных чисел "0" 

а Использовать значение следующего аргумента в качестве ширины поля 

число$ Использовать значение аргумента в позиции число 

*число$ Использовать значение аргумента в позиции число в качестве ширины поля 

число Минимальная ширина поля (не существует эквивалента для обозначения 
максимальной ширины поля) 

„число «Точность»: количество цифр после десятичной запятой для вещественных 


чисел, максимальная длина для строки, минимальная длина для целого 


Ниже мы приведем несколько примеров. Добавление пробела перед буквой спе- 
цификатора обеспечивает вывод ровно одного пробела перед числом, независимо 
от его размера: 


ргтпЕЕ “<% >", 1, # "< 1>" 


Добавление символа + обеспечивает вывод знака положительного числа, даже ес- 
ли это число 0:1 


ргіпі? "<%+0>", 1; В "<+1>” 
ргіпі? “<%+9>", 2, # “<+2>" 


Добавление пробела и знака + в паре в любом порядке обеспечивает вывод знака + 
перед положительным числом: 


ргіпі? "<%+ а>", 3; # "<+3>" 
резпЕР "<% +09>", 5; В "<+5>" 


Определение точности для целого числа обеспечивает дополнение нулями слева. 
Знак + не учитывается при расчете ширины поля: 


рг1пЕР "<%. 59>", 8; # "<00008>” 
ргіпі? “<%+.549>", 13; # "<+00013>” 


Если ширина поля оказывается больше, дополнение нулями будет выполнено 
только до ширины, указанной в атрибуте точности. Значения можно выравни- 
вать по левому или по правому краю: 


резпеЕ "<%-10.64>", 21; # "<000021 >" 
ргіп? “«%10.60>“, 34. # "< 000034>" 
ргіпіе "<#010.64>”, 55; # "< 000055” 
ргіпіе "<+10.60>", 89; # "< +000089" 


Это отличается от понятий приближения предела к нулю с разных сторон, О+ и 0. 
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Все это в равной степени относится ко всем целочисленным форматам. 


Строки по умолчанию выравниваются по правому краю, но, применив знак «ми- 
нус», можно добиться выравнивания строк по левому краю: 


ргіптғ "<%65>°, 144; # “< 144>” 
ргіпі? “<%-6$>” 233; В "<233 >" 


Начальный 0 обеспечивает заполнение пустых позиций нулями, но только слева, 
даже если значение не является числом: 


ргіпіғ "<%065>°, 377; й "<000377>” 
ргіпіТ "<%-065>° 610; # "<610 >” - ведущие нули не выводятся 
ргіпт? ”<%06$>”. "Рег1": # "<00Рег1>"“ 


Значение ширины удобно использовать для выравнивания строк по колонкам 
фиксированной ширины. Однако ргіпї? интерпретирует значение ширины толь- 
ко как минимальное значение. Она не производит усечение строк: 


ргіпЕЁ ”<%5$>”. ‘Ате]1а”: # “<Ате]1іа>", выводятся все шесть символов 


Если требуется обеспечить усечение строк, можно указать значение точности 
число после значения ширины поля: 
ргіпіҒ ”<%5.5$>", `Сате1іа”; я "<Сате1>”, только пять символов 
Ширина поля и количество допустимых символов могут не совпадать. Если в па- 


раметре точности будет указано больше символов, чем в параметре ширины по- 
ля, ширина поля будет игнорироваться: 


ргіп? "<%3.55>\п”, "Сате1іа“; # "<Сате1>" 
Обычно функция ргігії? замещает спецификатор следующим неиспользованным 
аргументом, но с помощью параметра число$ можно явно указать, какой аргумент 
использовать. При использовании параметра число$ следует предпринять все ме- 
ры, чтобы по ошибке не использовахь интерполируемую строку или не экраниро- 


вать знак доллара; в противном случае, Рег! будет думать, что вы пытаетесь ин- 
терполировать переменную в этом месте. 


ри1пЕЕ '%2$9 %1$0`, 12, 34; н 734 12" 
ргіпЕ? `%3$9 %0 %1$0`, 1, 2, 3; # "31 1" 


Этот прием позволяет повторно использовать аргументы: 
ргіпі? '%2$9 %1$9 %2$а , 12, 34; в "34 12 34" 
Иногда ширина поля неизвестна заранее, поэтому предоставляется возможность 


передать ее в аргументе с помощью *. Этот флаг извлекает значение ширины из 
аргумента, предшествующего аргументу со строкой: 


ргіпіЁ “<%*3>”, 6, “Рег1”; # "< Рег1>” 


Если аргумент имеет отрицательное значение, выполняется выравнивание по ле- 
вому краю: 

ргіпЕ? “"<%+$>", -6, “Рег1”; # "<Регі >" 
Для определения номера аргумента с шириной поля можно использовать пара- 
метр вида число$: 


ргіпЕ? `<%«2$95>', “а”, 6; # “< ах" 
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Если потребуется передать в аргументах ширину поля и максимальное количест- 
во выводимых символов, используйте * в обеих позициях: 


ргіпі? "<%. *5>\п”, 10. 5. "СатеЈіа“; # “< Сате1>” 
но номер аргумента можно указать только для значения ширины: 


ргіпі? *<%*2$.»*$> , "Сате1іа", 10, 5, # "< СатеІіа>” 
ргіпі? "<. *295>'`, "Сате1іа“, 10, 5; # "<. *2$5>" 


Флаг # обеспечивает вывод перед числом дополнительных символов, обозначаю- 
щих систему счисления, но только когда значение не равно 0 (в этом случае систе- 
ма счисления не имеет значения): 


ргіпі? "<#>", 37; # "<045>" 


ргіпЕР "<%#х>", 42. # "<0х2а>" 
ргіпі? “<ЖиХ>2", 42; в "<ОХ2А> 


ргіпі? "<№0>", 137, я "<0610001001>" 
ргіпі? "<ю8>", 137; # "<0810001001>” 


Когда в спецификаторе Фо указаны и флаг #, и значение точности, точность не 
учитывает ведущий «0»: 


ргіпі? ”<%#.50>”, 0377; н "<00377>" 
ргіпЕТ "<. бо>", 010755; # "<010755>" 
ргіпЕР "<. 00>", 0; в "<0>" 


Для вещественных значений (%е, #! и %9) можно указать количество десятичных 
знаков после запятой с помощью параметра „число. Если используется параметр 
ширины поля, точность указывается вслед за ним. Имейте в виду, что этот пара: 
метр приводит к округлению чисел перед выводом: 


ргіпі? ”<%Р>", —3.14159265; # “<3. 141593>" 
ретпЕР "<. 172", 3.14159265; # "<3.1>” 
ргіпі? "<№.0ғ>", 3.14159265; # “<3>" 


реіпі? "<қе>", 6. 62606857е-34; # “<6. 626069е-34>” 
ргіпі? "<%. 162" 1.05457148е-34: # "<1. 1е-34>` 


Если задействована прагма изе 1оса1е (см. главу 29) и была вызвана функция 
РОЅІХ::ѕеї1оса1е, в качестве разделителя целой и дробной части будет использо: 
ваться символ, определяемый региональными настройками: 


ие РОЅІХ; 
и5е 1оса1е; 


РОЅІХ: : 5е11оса1е(1С_МИМЕАТС, "#г_ РА”); 
ргіпі? "<>", 3. 1415926; # “<3, 141593>” 


Спецификатор %0 использует системные настройки, поэтому в разных системах 
могут получаться немного разные результаты: 


ргіпее "<%9>", 1 << 31; 8 "<2.14748е+09>" 
ргіпі? "<%.50>", 1 << 31; в "<2.1475е+09>" 
ргіпі? "<. 109>", 1 << 31; # "<2147483648>" 
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Выбор количества мест для отображения экспоненты со значением меньше 100 за- 
висит от системы. В некоторых системах значение может дополняться нулем слева: 


ргтпЕЁ "<%9>” 1 << 31; # "<2.14748е+009>", может быть 


Спецификатор у отличается от других. Он считает свой строковый аргумент век- 
тором, где каждый элемент является целым числом, которое требуется вывести 
с указанным форматированием. Он выводит целые числа через точку. Использо- 
вание спецификатора шестнадцатеричной системы счисления может пригодить- 
ся для вывода последовательностей кодов символов в стиле Юникода: 


ре1пЕЕ ”<#м9>", “\х5\хЕ\х2”; # 5. 14.2" 


иѕе иЁғ8; 

ргіпіё "<%уй>", "А"; и "<65.758.37. 123>" 

ргапЕЕ “<#мХ>", "А"; в "<41.300.25.7В>" 

ргіпіе “0+у404х", “АЖ{”; # "0+0041.0300.0025. 0078" 


(Обратите внимание, что графема «А» выше состоит из двух кодов символов.) 


Если нежелательно использовать точку между числами, можно передать свой 
разделитель в аргументе: 


ргіпте "<%»\хХ>", ‚ "А; В 7<41:300:325:7В>" 
ргіпі? "<%»2$уХ>", "АЖ" "27: в "<41:300:25:7В>" 


Графемы, в особенности состоящие из нескольких кодов, создают определенные 
проблемы. Как будет показано далее в этой главе, в ходе рассказа о двух других 
форматах, Ре] дает неправильный ответ при вычислении ширины для данных 
в Юникоде, содержащих непечатаемые символы, комбинационные знаки и широ- 
кие символы. То же относится к параметру ширины поля в строках формата для 
ре1пЕЕ и ѕргіпі?. В разделе «Графемы и нормализация» главы 6 приводится при- 
мер, демонстрирующий, как можно воспользоваться методом со1итпз из модуля 
Џпісоае::0С5+гіпд, чтобы обхитрить ргіпі# и заставить ее работать правильно, не- 
смотря на описываемые недостатки. Суть стратегии состоит в том, чтобы предва- 
рительно определить правильную ширину поля с помощью умного метода со]ийпз, 
не рассчитывая, что бесхитростная функция ргіпїї осилит сложные вычисления. 
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Если вы знакомы с традиционными языками программирования, то, вероятно, 
уже сталкивались с понятием записей или структур. В противоположность функ- 
ции зргіпіѓ, основным назначением которой является создание строк, понятных 
человеку, функции раск и ипраск предназначены для низкоуровневых преобразо- 
ваний и форматирования структур или записей данных простых типов в строко- 
вое представление (и обратно). Обе функции используют общий язык шаблонов 
с небольшими отличиями, описываемыми в следующем разделе. 


раск 
раск ТЕМРЕАТЕ, 115Т 


Эта функция принимает список / 157 обычных значений Рег]. преобразует их в стро- 
ку байтов согласно шаблону ТЕМРІАТЕ и возвращает эту строку. Список аргументов 


756 Глава 26. Форматы 


при необходимости дополняется или обрезается, т.е. если задать меньше аргумен- 
тов, чем требует ТЕМРІАТЕ, раск будет интерпретировать недостающие аргументы 
как пустые значения, а если задать больше аргументов, чем требует ТЕМРІАТЕ, лиш- 
ние аргументы игнорируются. Нераспознанные элементы формата в ТЕМРІАТЕ вы- 
зывают исключение. 


Шаблон описывает структуру строки как последовательность полей. Каждое по- 
ле представлено одним символом, описывающим тин кодируемого в нем значе- 
ния. Например, символ формата № задает четырехбайтовое целое число без знака 
с прямым (Ы2-епЧ1ап) порядком следования байтов. 


Поля упаковываются в порядке, задаваемом шаблоном. Например, чтобы упако- 
вать в строку однобайтовое целое без знака и значение с десятичной запятой 
с одинарной точностью, следует сказать: 


$$Тг1пд = раск(”СЕ", 244, 3 14); 


Первый байт возвращаемой строки имеет значение 244. В остальных байтах будет 
закодировано число 3.14 как число одинарной точности с десятичной запятой. 
Конкретная кодировка числа с десятичной запятой зависит от аппаратной архи- 
тектуры компьютера. 


При упаковке нужно учитывать следующее: 
• тип данных (например, целое число, число с десятичной запятой, строка); 


• диапазон значений (например, помещаются ли ваши целые числа в один, два, 
четыре или, может быть, даже восемь байтов; упаковываете ли вы восьмираз- 
рядные символы или символы Юникода); 


• являются ли целые числа знаковыми или беззнаковыми; 


• какая кодировка используется (родная, с обратным – і #е-епдіап - или с пря- 
мым - Ыр-еп01ап — порядком следования битов и байтов). 


В табл. 26.6 перечислены символы формата и их значения. (В форматах встреча- 
ются и другие символы, которые будут описаны далее.) 


Таблица 26.6. Символы шаблона для расЕ/ипрасЁЕ 


Символ | Значение 


а Строка байтов, дополняемая нулевыми байтами слева 

А Строка байтов, дополняемая пробелами слева 

Б Битовая строка в порядке возрастания старшинства разрядов в каждом байте 
(как \ес) 

В Битовая строка в порядке убывания старшинства разрядов в каждом байте 


Восьмиразрядное целое со знаком 
Восьмиразрядное целое без знака; смотрите для Юникода 


Число с десятичной запятой двойной точности в родном для архитектуры фор- 
мате 


р Число с десятичной запятой или число с десятичной запятой двойной длины 
в родном для архитектуры формате; числа с десятичной запятой двойной длины 
доступны, только если система поддерживает их и ре] скомпилирован с их под- 
держкой 


Двоичные форматы ; 757 


Символ | Значение 


Е = 


о о 


Число с десятичной запятой одинарной точности в родном для архитектуры фор- 
мате 


Число с десятичной запятой во внутреннем представлении Ре! (МУ) в родном 
для архитектуры формате 


Шестнадцатеричная строка, младший полубайт впереди 
Шестнадцатеричная строка, старший полубайт впереди 


Целое со знаком ь родном для архитектуры формате; не менее 32 разрядов, но 
может быть и больше, в зависимости от использованного компилятора С 


Целое без знака в родном для архитектуры формате; не менее 32 разрядов, но мо- 
жет быть и больше, в зависимости от использованного компилятора С 


Целое со знаком во внутреннем представлении Рег] (ТУ) 

Целое без знака во внутреннем представлении Рег! (ОУ) 

Длинное целое со знаком, всегда 32 разряда 

Длинное целое без знака, всегда 32 разряда 

16-разрядное короткое целое с «сетевым» (Ы5-еп1ап) порядком следования битов 
32-разрядное длинное целое с «сетевым» (ђіс-епдіап) порядком следования битов 
Указатель на строку, завершающуюся пустым символом (пи!) 

Указатель на строку фиксированной длины 

64-разрядное целое (диад) со знаком 


64-разрядное целое (дџад) без знака (только если система поддерживает 64-раз- 
рядные числа. и ре] скомпилирован с их поддержкой) 


Короткое целое (ѕћогі) со знаком, всегда 16 разрядов 
Короткое целое (ѕћогі) без знака, всегда 16 разрядов 
Строка в кодировке ицепсоде 


Номер символа Юникода; в текстовом режиме выполняется преобразование 
в символ, а в двоичном -— в соответствующий код ОТЕ-8 


16-разрядное целое с порядком следования битов «УАХ» (|1 е-еп@ ап) 
32-разрядное целое с порядком следования битов «УАХ» (Ш е-еп@1ап) 


Сжатое целое в формате ВЕК (Віпагу Епсодед Кергеѕепѓайоп — представление 
в двоичном формате) 


Значение символа без знака 
Нулевой байт (проскочить на байт вперед) 
Вернуться на байт 


Строка байтов, завершающаяся нулевым байтом (и дополненная нулевыми бай- 
тами) 


Заполнить нулями до абсолютной позиции 
Заполнить нулевыми байтами или обрезать до абсолютной позиции 
Начало группы 


Конец группы 
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Таблица 26.7. Модификаторы шаблонов для расЁ/ипрасЁ 


Модификатор | Применяется к | Действие 


Принудительно устанавливает родные для архитектуры 
размеры 


Символы хи Х действуют как символы выравнивания 
Целые без знака интерпретируются как целые со знаком 


Определяет позицию смещения во внутреннем представ- 
лении строки – опасно! 


> 9012113511 рРч0$$ | Принудительно устанавливает прямой (Ьір-епӣіап) по- 
рядок следования байтов; может применяться к груп- 
пам и подгруппам 


< 902113411 рРа0$$ | Принудительно устанавливает обратный (114 е-епд ап) 
порядок следованин байтов; может применяться к груп- 
пам и подгруппам 


В шаблонах можно свободно располагать пробельные символы и комментарии. 
Комментарии начинаются символом # и простираются до первого символа пере- 
вода строки (если он есть) в шаблоне. 


Повторение 


За каждой буквой в шаблоне может следовать число, означающее счетчик (соип)), 
интерпретируемое как число повторений или некоторого рода длина, в зависимо- 
сти от формата. Начнем с повторений, которые упаковывают символы или числа: 
с, С, 9, 0, К Б 1, І, ј, Ј, 1, і, п, М, р, 0, 0, 5, $, Ц, м, №, мии. 


Число после этих форматов представляет повторение, т.е. поле будет повторяться 
в строке, извлекая указанное число аргументов: 


$оиЕ = раск °04`. 192 168, 1. 1 и \хСО\хАВ\О1\01 
Необязательное число повторений заключается в квадратные скобки: 
$ои = раск *С[4] , 192, 168, 1, 1 # \хСо\хА8\01\01 


Буква в квадратных скобках обозначает длину соответствующего формата: 


Фи 
фоиї 


раск `С[№] , 192, 168, 1, 1 # \хС0\хАВ\01\01 
раск `С[$]”, 192, 168, 1, 1 # \хСО\хАВ 


При нехватке аргументов лишние поля заполняются нулями: 
фои? = раск 'С4 , 192, 168; # \хСО\хА8\00\00 

Символ + соответствует всем оставшимся аргументам: 
фош = раск ‘С* , 192, 168, 1, 1, # \хСО\хАВ\О1\01 


Остальные буквы меняют свой смысл с повторениями. Число после а, Аили 7 оп- 
ределяет длину, до которой должно быть дополнено поле: 


фоої = раск `А10`, 192, 168, 1 1. # \хСО\хА8\О1\01 


Если число меньше длины строки, а иА обрезают ее: 
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фои = раск А4 , Ате]ла’, # "Апте1" 
фои{ = раск а4’, Ате]ла’, # “Апе]" 


В сочетании с + спецификаторы а и А воспроизводят поле с шириной, соответст- 
вующей аргументу: 


$оџі = раск ‘Аз, Ате1іа`, # “Ате]ла 
ФоиЕ = раск а*`, Ате1іа`; # "Ате1іа" 


Однако 7 резервирует последнюю позицию для завершающего нулевого байта: 
$оит = раск 74, Ате1іа`; # "Ате\000" 


при условии, что число не равно нулю; в противном случае нулевой байт не добав- 
ляется: 


фои = раск '70`, Ате]іа`; # "" 


Комбинация 7* извлекает строку целиком, независимо от ее длины, и завершает 
ее нулевым байтом: 


$оит = раск 7*, АтеШа’; # “Ате1іа\000" 
Форматы р и В выводят указанное количество разрядов. р и В используют только 


один разряд (самый младший) из символов на входе и устанавливают только один 
разряд на выходе: 


ФоиЕ = раск 88°, '10011101°; # 0010011101 
Фоиф = раск '08', '10011101°; # 0610111001 


Форматы һ апа Н действуют аналогично, используя счетчик в качестве числа по- 
лубайтов. Однако их особенность состоит в том, что символы, выглядящие как 
шестнадцатеричные цифры, интерпретируются как числа: 


н 


фош = раск '‘ћ1`, ‘а’; # Ох0а 
фои = раск "НІ’, ‘а’; 9 Оха0 
фои = раск "Н8`, `еадбееї’ # Охаеадоееғ 


В противном случае используется младший полубайт: 


$оит = раск "ћ2`, '1, # 0х01 
фои = раск 'ћ2`, ‘опе `; # 0х08 
фои = раск ‘Н2’. ‘опе’: # 0х80 


И 


Символ * с форматами һ и Н обеспечивает дополнение строки нулями до четного 
количества полубайтов: 


фоџі = раск Н*'`, ‘деадбее`; # Охавадбее0 


С форматом Р счетчик определяет размер структуры для упаковки. 


С форматом и счетчик обозначает длину строки в кодировке циепсоде. Счетчик 
меньше 3 (или если используется +} интерпретируется как 45. Следующий формат: 


ФоиЕ = раск "030°, $ѕопе_ѕїгіпо; 
примет всю строку: 
ЭЗМУЕ( ' )1; Е<0=8\@<65192!Т: &5М(8%1; 
Но та же строка с меньшим значением счетчика: 


фоџї = раск “015`, $ѕоте_5ігіпд; 
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будет перенесена: 


/ЗУҮЕС( ` )І; Е<@=&\@<651 
*92!Т:&5М(&%; `` 


Формат х не использует аргументы, но вставляет указанное число нулевых бай- 
тов. Модификатор * действует как значение 0: 


$оиї = раск 'Н2 х №2", "“деад”, "бее?”, # Охӣе00ер 
фои = раск "Н2 х3 ћ2", “деад”, “рееғ”; # 0хд9е000000еь 
$ои{ = раск “Н2 х» 12”, ‘деад”, "бееғ“; # Охдеер 


Формат Х не использует аргументы. Он возвращается на указанное число байтов 
назад, при условии, что не произойдет выход за начало строки. Символ + интер- 
претируется как 0: 


$оиё = раск "Н2 Х ћ2", “деад“, "Бееї", # Охер 
ФоиЕ = раск "Н2 ХЗ ћ2", "бега", "рее"; # Охде000000еб 
Фоиф = раск “Н2 Х» 12”, "деаа“, "бееғ"; # Охаеес 


Формат @ обрезает или дополняет до позиции относительно начала самой внут- 
ренней группы (или всей строки, если группы отсутствуют). Если упакованная 
строка получается длиннее счетчика, она обрезается до длины, указанной в счет- 
чике. Если упакованная строка оказывается короче счетчика, она дополняется 
до длины, указанной в счетчике. В любом случае оставшаяся часть шаблона бу- 
дет выполнять заполнение с новой позиции: 


$оиї = раск А», Апе]1іа’, # Ате11а 
$ои{ = раск А»@3`, ‘Ате?ла`; в Апе 
фои = раск А»*@3А*'`. Ате11а’. `Сате1`; # АтеСате] 


Фоит = раск с@5', 137; # 0х8900000000 

Символ + интерпретируется как 0, поэтому он обрезает все, следующее далее: 
фоџї = раск 'А+@*А*‘, Ате]1а’, '`Сате1`; # Сате1 

Внутри группы обрезание или дополнение применяется только к группе: 


фои = раск 'А(А@4А)А`, ‘А, В’, °С", "0'`, в 7АВ\000\000\00060 

фооі = раск А(А@«А)А`, 'А’`, `В’, °С’, 0"; # АСО 
Формат (точка) также обрезает или дополняет, но принимает номер позиции из 
списка аргументов. Счетчик повторений определяет начальную позицию приме- 
нения: 0 — начать с текущей позиции, другое число определяет номер группы, а * 
соответствует началу строки: 


# обрезать от начала строки 
$оџі = раск `А(А. *А)А`, "А" `В’, 1, С”, "0 В АСО’ 


# дополнить от начала строки 
фоџї = раск `А(А. *А)А`, А’ `В`, 5, °С’, "0 # "АВ\О00\000\000С0" 


# обрезать от начала строки 
фоиЕ = раск А(А. 1А)А`, "А, ‘В’, 1, ‘С’, "0°, # "АВС" 


# дополнить от начала строки 


Двоичные форматы 761 


фос = раск А(А.1А)А’, “А , `В’, 3, °С’, "0°, # "АВ\000\000\000\000С0" 


# дополнить от текущей позиции 
$оиї = раск `А(А.ОА)А’, "А`, В’, 0, `С', `0’; # “АВСО" 
фои = раск А(А.ОАЗА’, `А`, В’, 2, С’, `0’; # "АВ\000\00060" 


Другие модификаторы 


Символ / позволяет упаковывать и распаковывать строки, в которых упакован- 
ная структура содержит счетчик байтов, за которым следует сама строка. Про- 
граммист пишет: 1еп0+ћ-іїеп/ѕїгіпд-іїет. Элемент 1епоїћ-іѓет может быть любой 
буквой шаблона для раск и описывает, как упаковано значение длины. Чаще все- 
го используются форматы упаковки целых чисел, такие как п (для строк Јауа), 
м (для АЗМ.1 или ЗММР) и № (для Вип ХОВ). Элемент ѕігіпд-іѓет должен (на мо- 
мент написания книги) принимать значение А», а» или 2». Для ипраск длина строки 
извлекается из Јепдіћ-іѓет, но если указать *, она игнорируется: 


ипраск “С/а”, “\04бигизату”; в дает "биги" 
ипраск “аз/А* А«”, "007 Вопа 4”; # дает (° Вопа`. ``) 
раск “п/а* м/а»“, "ће110, , “мог14”; # дает “\000\006һе110, \О05мог1а" 


Элемент Јепдїһ-іѓет не возвращается ипраск явно. Добавление счетчика к букве 
]епд"-Пеп вряд ли принесет какую-либо пользу, если только эта буква не А, а или 7. 
Упаковка с форматом 16п9#һ-іѓет, равным а или 2, может вводить нулевые симво- 
лы (\0), которые Реп не считает допустимыми в числовых строках. 


За целочисленными форматами $, 5, 1 и | может непосредственно следовать ! для 
обозначения родных для архитектуры коротких или длинных чисел вместо ровно 
16 или 32 разрядов соответственно. Сегодня это представляет проблему в основ- 
ном на 64-разрядных платформах, где родные для архитектуры короткие и длин- 
ные числа могут иначе представляться местными компиляторами С. (і! и! тоже 
допустимы, но только для полноты картины; они идентичны : и Г.) 


Фактический размер родных для архитектуры типов ѕћогі (короткий), іпї (це- 
лый), 1000 (длинный) и 1010 10пд (удвоенный длинный) в байтах на той платфор- 
ме, где был скомпилирован Рег], тоже доступны посредством модуля (010110: 


иѕе Соп{19; 

зау $Соп?іо{ѕһогїѕ17е}; 
ѕау $Сопғіо{іпеѕіғе}; 

ѕау $Сопғід{10п95і2е}; 
зау $Соп?іо{10пд1опдѕіхе}; 


Из того, что Сопѓісиге известен размер 1070 1019, не обязательно следует, что вам 
доступны форматы а или 0. (В некоторых системах это так, но у вас, вероятно, не 
такая. Пока.) 


Целочисленные форматы длиной более одного байта (5, 5, і, 1, 1 иі) по природе 
своей непереносимы между процессорами, поскольку подчиняются родному для 
архитектуры порядку следования байтов. Чтобы получить переносимые упако- 
ванные целые, используйте форматы п, №, уи \; для них порядок следования бай- 
тов и размеры известны. 


Числа с десятичной запятой имеют только родной, аппаратный формат. Из-за 
многообразия форматов с десятичной запятой и отсутствия стандартного «сетево- 
го» их представления, надежный обмен этими данными невозможен. Это значит, 
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что упакованные числа с десятичной запятой, записанные на одной машине, мо- 
гут не читаться на другой. Проблема не решается, даже если обе машины исполь- 
зуют арифметику с десятичной запятой ІЕЕЕ, поскольку порядок записи байтов 
в память (прямой и обратный) не входит в спецификацию ТЕЕЕ. 


Рег внутренне использует представление с двойной точностью во всех вычисле- 
ниях с десятичной запятой, поэтому при преобразовании из двойной точности 
в обычную и обратно теряется точность представления. Это значит, что ипраск("{", 
раск("#", $Роо)) не всегда равно $00. 


Программист берет на себя ответственность за любые особенности выравнивания 
или форматирования, относящиеся к другим программам, особенно к созданным 
компилятором С - а это зверь со своими представлениями о том, как размещать 
структуру на С для конкретной рассматриваемой архитектуры. Для этого при 
упаковке придется добавить достаточное количестьо х. Например, объявление С: 


Ѕігисї Ғоо { 
ипѕідпеа сћаг с; 
Ғ1оаї Г; 

}; 


можно вывести с использованием формата °С х Г", “С х3 Г" или даже "Г С". Функ- 
ции раск и ипраск считают входные и выходные данные однообразными байтовы- 
ми последовательностями, поскольку не могут знать, куда данные отправляются 
или откуда поступают. 


Применение модификатора ! к формату @ или определяет смещение в байтах 
внутри упакованных строк. Это может повысить эффективность. но при этом тре- 
бует более полных знаний о строке и ризмерах других форматов. 


Модификаторы < и >, определяющие порядок следования байтов, предназначены 
для использования с форматами 4, 0, #, Б, 1, І, ј, Ј, 1,1, р, Р, а, 0, зи $. Эти модифи- 
каторы упаковывают целые числа с определенным порядком следования байтов. 
Модификатор < принудительно устанавливает обратный (Ш е-епЧ1ап) порядок 
следования байтов, а > – прямой (ђіс-епдіап): 


Фоит = раск '1>', ОхрЕАрВЕЕЕ; # “\хрЕ\ХАО\хВЕ\ХЕЕ" 
$оиї = раск '`_<`, ОхОЕАОВЕЕЕ; # “\хЕР\хВЕ\хАО\хОЕ” 
Дополнительные примеры 


Рассмотрим еще несколько примеров. Первая пара упаковывает числовые значе- 
ния в байты: 


$оџї = раск "СССС”, 65, 66, 67, 68: # $оиЕ ед “АВСО” 
$оит = раск "С4”, 65, 66, 67, 68; # то же самое 


Следующая инструкция делает то же самое с буквами Юникода, заключенными 
в кружок: 


$Роо = раск( "04", 0х2466, 0х2407, 0х2408, 0х2459); 
Следующая инструкция делает то же самое, вводя пару пустых символов: 
фои = раск "ССххСС", 65, 66, 67, 68, # ФоиЕ ед "АВ\ОҲОСО" 


Упаковка коротких чисел не значит, что достигнута переносимость: 
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ФоиЕ = раск "52°, 1, 2; й “\1\0\2\0" с обратным порядком следования байтов 
# МОМ 1Х0\2" с прямым порядком следования байтов 


При упаковке двоичных и шестнадцатеричных чисел счетчик указывает коли- 
чество битов или полубайтов, а не создаваемых байтов: 


фои? = раск "832", ”01010000011001010111001001101100”, 
ФоиЕ = раск "Н8“, “”5065726с"; # обе возвращают “Рег1“ 


Длина поля а относится только к одной строке: 
ФоицЕ - раск ”а4” "арса". ‘х”. “у”. "2"; # “абс” 


Это ограничение можно обойти, указав несколько спецификаторов: 


фои = раск “аааа", “абса”, “х”, “у”, "2"; # "аху2" 
$оит = раск а” х 4, “абса”, "х", "у", "2"; # "аху2" 


Формат а осуществляет заполнение нулями: 
$оит = раск "а14", “абсаегд”; # “арсдеѓо\о\о\о\о\о\о\о” 


Следующий шаблон упаковывает запись С ѕїгис+ їп (по крайней мере, в некото- 
рых системах): 


Фоит = раск "19р1", отїі1те(), $42, $т0##; 


Обычно тот же формат можно использовать с функцией ипраск, хотя некоторые 
спецификаторы действуют иначе, особенно а, Аи 7. 


Если нужно объединить текстовые поля фиксированной ширины, применяйте 
раск с ТЕМРЕАТЕ из вескольких форматов А или а: 


$$1г1пд = раск{"А10” х 10, @бата); 


Нельзя сказать, что «А» слишком опасен: он прекрасно справляется с внутрен- 
ним представлением Юникода в Рег]. Но этот спецификатор производит дополне- 
ние по кодам символов, а не по логическим позициям вывода. Если потребуется 
обработать ваше гёзите, это можно сделать, как показано ниже: 


раск(”(А10)2”, “ге\х{301 }зите\х4301}”, “могКк”)’ 
“гезите могк д 


Но если потребуется повторить обработку, вы можете получить: 


зау раск(”(А10)2”, “гезите“, “могк”) 
геѕипе могК 


В разделе «Графемы и нормализация» главы 6 демонстрируется, как с помощью 
метода со1итпѕ из модуля Џпісоае::СС5їгіпо реализовать корректное дополнение 
при наличии в строке управляющих символов. комбинационных знаков и широ- 
ких (занимающих две позиции вывода) букв, которые можно найти во многих 
восточноазиатских алфавитах. 

Если потребуется объединить текстовые поля переменной длины через раздели- 
тель, используйте функцию јоіп: 


феігіпд = јоіп(” апа “, @дата); 
$$1г1п9 = јоіп(””, @дата); # пустой разделитель 
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Во всех приведенных примерах шаблонами служили литеральные строки, одна- 
ко нет причин, почему нельзя загружать шаблоны из файла на диске. На этой 
функции можно построить целую систему реляционной базы данных. (Не станем 
уточнять, как это охарактеризует автора подобной затеи.) 


ипраск 
ипраск ТЕМРІАТЕ ЕХРВ 


Эта функция оказывает действие, обратное раск: она распаковывает строку (ЕХРА), 
представляющую структуру данных, в список значений согласно шаблону ТЕМР: АТЕ 
и возвращает эти значения. В скалярном контексте она может применяться для 
распаковки одного значения. Шаблон ТЕМРІАТЕ имеет формат, сходный с используе- 
мым в функции раск, — он задает порядок следования и типы значений, которые 
должны быть распакованы. Подробное описание ТЕМРЕАТЕ приведено в описании 
функции раск. Недопустимый элемент в ТЕМРЕАТЕ либо попытка выйти за пределы 
строки в форматах х, Х или @ вызывает исключение. 


Строка разбивается на фрагменты, описываемые ТЕМР!АТЕ. Каждый участок от- 
дельно преобразуется в значение. Обычно байты в строке либо получены с помо- 
щью раск, либо представляют некую структуру на С. 


Если счетчик повторений поля больше, чем позволяет остаток входной строки, 
счетчик автоматически уменьшается. (Обычно в таких случаях в качестве счет- 
чика повторений следует использовать *.) Если входная строка длиннее, чем опи: 
сано в ТЕМРІАТЕ, оставшаяся часть строки игнорируется. 


Функция ипраск может быть полезна и при работе с обычными текстовыми фай- 
лами, не обязательно двоичными. Предположим, что имеется файл данных ста: 
кими записями: 


2009 Тһе бгауеуага Воок №11 баітап 

2008 Тһе У19915п Ро11сетеп’з Џпіоп Місһае1 Спабоп 

2007 Ваіпромѕ Епд \Мегпог Уіпде 

2006 Ѕріп Вобеге Сһаг1еѕ М150п 
2005 Јопаїһап Ѕїгапде & Мг №гге11 бизаппа С1аеКе 

2004 Раїадіп оР 50015 101$ МеМаѕ+ег Вијо1а 
2003 Нотіпійѕ Ворегё Ј. Замуег 

2002 Атегісап 0600$ №11 Саітап 


2001 Наггу Ротфег апа һе боб]еф ог Е1ге Ј. К. Вом1іпс 


Такой файл мог быть создан с помощью функции ргіпії, описанной выше в этой 
главе, или с применением форматов, описанных в следующем разделе. Он так же 
мог быть создан какими-либо внешними инструментами. В любом случае, не по- 
лучится применить $р1ії для выделения полей, поскольку границы полей опре- 
деляются не особым разделителем, а смещениями в записи. Поэтому, хотя это 
обычные текстовые записи, фиксированный формат позволяет разобрать их с пс- 
мощью ипраск: 


иѕе %5. 14; 

ме (<>) { 
пу(фуеаг, $їіїЛе, Фаи Вог) = ипраск(”А4 х АЗ9 А»", $_); 
ѕау “$аџіһог моп ${уеаг}‘з Нидо Рог $1111е.”; 
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(Мы написали ${уеаг}'5, потому что Рег! посчитал бы $уеаг'ѕ за Фуеаг: ‘5. Если бы 
в исходном коде программы использовалась директива изе 18, включающая 
поддержку кодировки ОТЕ-8, можно было бы безопасно использовать форму за- 
писи $уеа! '5.) 


Кроме полей, допустимых в раск, можно задавать для поля префикс %число, что соз- 
дает простую контрольную сумму объекта с указанным количеством разрядов, 
а не сам объект. По умолчанию это 16-разрядная сумма. Контрольная сумма созда- 
ется путем сложения числовых значений распакованных величин (для строковых 
полей берется сумма ога ($спаг), а для битовых полей – сумма нулей и единиц). На- 
пример, следующий код рассчитывает то же число, что и программа БузУ зит(1: 


ипдеѓ $/: 
$сһескѕит = ипраск (“%320*= <) % 65535: 


Следующая строка подсчитывает число установленных в единицу разрядов в би- 
товой строке: 


фѕеїб1тѕ = ипраск “%326*`, $зе1ес\тазк; 


Вот простой декодер ВАЗЕбА: 


мһі1е (<>) { 
ТГВА-7а-20-9+/##с0; # удалить символы не-раѕеб4 
ЕгЯА-7а-70-9+/# -_8; # преобразовать в формат циепсоде 
$1еп = раск( “с”, 32 + 0.75*1епдїһ); # вычислить байт длины 
ргіпі ипраск(”и”, $1еи $); # очудесоде и вывод 


} 


Форматы ри Р должны использоваться с большой осторожностью. Поскольку Рей 
не имеет механизма проверки допустимости адреса в памяти, переданного функ- 
ции ипраск и хранящего значение, передача недопустимого указателя наверняка 
приведет к пагубным последствиям. 


Если шаблон содержит больше спецификаторов, чем полей во входной строке, или 
если счетчики повторений приводят к выходу за границы строки, сложно пред- 
сказать, какой результат получится: счетчик может быть уменьшен; или ипраск 
может произвести пустые строки или нули, или возбудить исключение. Если вход- 
ная строка длиннее, чем описывает шаблон ТЕМР/АТЕ, остаток входной строки игно- 
рируется. 
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В Ре] имеется механизм, позволяющий создавать простые отчеты и диаграммы, 
которые вы часто могли видеть выползающими из матричного принтера. (Как! 
У вас нет ничего подобного?) Для упрощения этой задачи Рей помогает запро- 
граммировать вывод страницы близко к тому, как она будет выглядеть при печа- 
ти. Он позволяет следить, например, за количеством строчек на странице, номе- 
ром текущей страницы, управлять выводом заголовков страницы и т.д. Ключе- 
вые слова заимствованы из ҒОКТВАМ: Гогпат – для объявления и мгіїе — для вы- 
полнения; см. соответствующие разделы главы 27. К счастью, структура читается 
значительно легче — скорее как в инструкции РАІМТ 1516 языка ВАС. Можете 
считать, что это иго! (1) для бедных. (Если вы знакомы с пго{[, это может прозву- 
чать как антирекомендация.) 
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Форматы, как пакеты и подпрограммы, не выполняются, а объявляются, поэтому 
они могут находиться в любом месте программы. (Обычно все же лучше держать 
их все в одном месте.) У них есть собственное пространство имен, отличное от про- 
странств других типов в Рег1. Это значит, что если у нас есть функция с именем 
Роо, то это не то же самое, что формат Гоо. Однако именем по умолчанию для фор- 
мата, ассоциированного с некоторым дескриптором файла, служит имя этого де- 
скриптора файла. Поэтому формат по умолчанию для 5ТО0ЦТ называется "5ТООЦТ", 
а формат по умолчанию для дескриптора файла ТЕМР называется “ТЕМР”", Они толь- 
ко выглядят одинаково, но не являются одним и тем же. 


Форматы выходных записей объявляются так: 


Ғогта МАМЕ = 
ГОВМЕТУТ 


Если имя МАМЕ опущено, мы создаем формат 5Т000Т. РОЕМ! 157 состоит из последова- 
тельности строк, каждая из которых может иметь один из трех типов: 


• Комментарий (строка начинается символом #). 
• Строка шаблона (рістиге Ппе), определяющая формат одной выводимой строки. 


• Строка саргументами, дающими значения, встраиваемые в предшествующую 
строку шаблона. 


Строки шаблонов выводятся точно так, как они выглядят, за исключением того, 
что вместо некоторых полей подставляются их значения.! Каждое поле подста- 
новки в строке шаблона начинается с @ (ай) или ^ (крышка). Эти строки не подвер- 
гаются никакой интерполяции переменных. Поле @ (не путать с маркером масси- 
ва 6) представляет собой поле обычного типа; поле типа ^ предназначено для эле- 
ментарного заполнения многострочных блоков текста. Размер поля задается за- 
полнением его символами <, > или | для установки выравнивания соответственно 
по левому краю, правому краю или по центру. Если переменная превосходит за- 
данную для нее ширину, она усекается. 


Помните, что все эти разговоры о ширине и выравнивании разбиваются как волны 
о скалы, когда речь заходит о введении в шаблон «интересных» символов Юникода. 
Более того, проблемы начинаются даже с введением непечатаемых символов АЗСП. 
Механизм поддержки форматов шаблонов предполагает, что каждый код симво- 
ла соответствует ровно одной позиции вывода. В Юникоде это не всегда верно, по- 
скольку в Юникоде многие коды не имеют отдельной позицию при выводе, а неко- 
торые могут занимать две позиции. В разделе «Графемы и нормализация» гла- 
вы 6 демонстрируется, как с помощью метода со]итпз из модуля Џпісоде::бС51гіпо 
получить истинную ширину строки в позициях вывода. 


В качестве альтернативной формы выравнивания чисел по правому краю можно 
использовать символы # (после начального @ или "). Вместо одного из символов # 
можно вставить . (точку) и выровнять десятичные запятые. Если значение, пере- 


' Даже эти поля поддерживают целостность тех колонок, в которые они вставляют- 
ся. В строке нет ничего, что заставило бы поля расширяться, сжиматься или сдвигать- 
ся в том или ином направлении. Колонки, которые мы видим, священны в смысле 
УГУЗГИГУС исходя из предположения, что используется моноширинный шрифт. Даже 
для управляющих символов предполагается наличие ширины в один символ. 
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даваемое какому-либо из этих полей, содержит символ перевода строки, выводит- 
ся только текст перед этим символом. И, наконец, специальное поле ©* может слу- 
жить для вывода многострочных и неусеченных значений; в большинстве случа- 
ев оно должно быть единственным полем в строке шаблона. 


Значения задаются в следующей строке в порядке следования полей в шаблоне. 
Выражения, служащие источником значений, разделяются запятыми. Все выра- 
жения вычисляются в списочном контексте перед обработкой строки, поэтому 
одно списочное выражение может породить несколько элементов списка. Выра- 
жения могут располагаться на нескольких строках, если заключены в фигурные 
скобки. (При этом открывающая фигурная скобка должна быть первой лексемой 
первой строки.) Это позволяет выравнивать значения по соответствующим полям 
формата для облегчения чтения. 


Если выражение возвращает число со знаками после десятичной запятой и в соот- 
ветствующем шаблоне указано, что дробная часть должна выводиться (т.е. в лю- 
бом шаблоне, кроме множественных символов #, не содержащих точки .), то сим- 
вол, выбранный в качестве десятичной запятой, определяется текущей установ- 
кой 1С ММЕВІС. Это означает, например, что, если в среде этапа выполнения вы- 
браны немецкие национальные установки, вместо точки будет использоваться 
запятая. Дополнительные сведения представлены на страницах руководства реп- 
юсае. 


Пробельные символы \п, \ и \{ внутри выражения считаются эквивалентными 
одному пробелу. То есть можно считать, что следующий фильтр применяется для 
каждого значения формата: 


фуа1ие =- Ег/\п\\ғ/ / 


Оставшийся пробельный символ, \г, вызывает перевод строки, если строка шаб- 
лона это позволяет. 


Поля шаблона, начинающиеся символом ^, а не ©, обрабатываются особым обра- 
зом. Поле # заполняется пробелами, если значение не определено. Для остальных 
типов полей крышка ^ включает режим заполнения. Передаваемое значение 
должно быть не выражением, а именем скалярной переменной, содержащей стро- 
ку текста. Рег помещает в поле столько текста, сколько можно, а затем отсекает 
переднюю часть строки, так что при новом обращении к переменной может быть 
выведена следующая часть текста. (Да, это означает, что при выполнении вызова 
мгіїе переменная не сохраняется и сама изменяется. Сохранить исходное значе- 
ние можно во временной переменной.) Обычно для вывода текстового блока ис- 
пользуют ряд полей, выровненных по вертикали. Можно вывести в последнем 
поле символы &«...», которые будут завершать выводимые строки, если текст 
слишком длинный, чтобы вывести его полностью. Изменить символы, по кото- 
рым (или после которых) производится разрыв текста, можно, указав в перемен- 
ной $: (ФРОВМАТ [ТМЕ_ВВЕАК_СНАВАСТЕВЗ, если используется модуль Еп9?151) список 
желаемых символов. 


Следует понимать, что этот упрощенный порядок разрыва строк не имеет ника- 
кого отношения к более сложному порядку, который определяется приложением 
к стандарту Юникода «(АХ #14: Ошсоде Тапе Вгеакіпе А|огИ т». В случае 
с текстом Юникода должно использоваться свойство і іпе_ Вгеак= АГЕ (коротко `В) 
каждого символа в соединении с замысловатыми таблицами, чтобы определить, 
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где разрешаются разрывы. Чтобы дать вам представление, насколько это сложно, 
ниже приводятся возможные значения УАШЕ свойства в \р{ЕВ=УАГИЕ}: 


Атбідиоиѕ СопЕ1пдепт_ьгеак Іоеодгарп1с Роѕїғіх_ М№итегіс 
А1рһабетіс С1оѕе Рипсіџатіоп Іпѕерагаб1є Рге?іх_ М№тегіс 
Вгеак_Воїћ С1оѕе Рагепїћеѕіѕ ІпҒіх №тегіс Оиотатіоп 
Вгеак_АѓТег Сотріпіпа_Магк пе _Ғеед Ѕрасе 

Вгеак ВеҒоге Сотр1ех_Соптехї М№ехї Гіпе Џпкпомп 
Мапдатогу_Вгеак Ехс1атаїіоп №пзтагтег Мога _Јоіпег 
Вгеак_Ѕутро15 61ие М№итегіс 745расе 
Саггіаде_Веїигп Нурпеп Ореп_Рипсїџатіоп 


Системы письменности, где не используются пробелы или дефисы, особенно 
чувствительны к разрывам строк, поэтому данный способ — единственно вер- 
ный. Модуль Џпісойе::ІіпеВгеак из СРАМ, включающий популярный модуль 
Џпісоде::6С5їгіпу, полностью реализует требования приложения «ПАХ #14», 
включая обработку восточноазиатских систем письменности. Возможно, вам по- 
требуется задействовать этот модуль при необходимости использовать более 
сложные наборы символов, чем АБСП. 


В случае применения полей ^ могут создаваться записи переменной длины. Если 
форматируемый текст короткий, просто повторите строку формата с полем ^ не- 
сколько раз. Для коротких данных это приведет к выводу нескольких пустых 
строк. Для подавления вывода пустых строк поместите в любом месте строки 
символ - (тильда). (Сама тильда при выводе будет переведена в пробел.) Если ря- 
дом с первой тильдой поместить вторую, строка будет повторяться, пока не исчер- 
пается весь текст в полях этой строки. (Этс возможно потому, что поля ^ «съеда- 
ют» выводимые ими строки. Но если используется поле типа @ вместе с двумя 
тильдами, То желательно, чтобы передаваемое в него выражение не выводило од- 
но и то же значение до бесконечности! В этом случае используйте оператор ѕћіѓї 
или какой-либо другой с побочным эффектом. позволяющим исчерпать список 
значений.) 


Обработка начала страницы по умолчанию осуществляется форматом, имя кото- 
рого состоит из имени текущего дескриптора файла с присоединенными в конце 
символами ТОР. Она выполняется в начале вывода каждой страницы. См. описа- 
ние игЦе в главе 27. 


Вот несколько примеров: 


# отчет по файлу /еїс/раѕѕио 
Ғогтаї 5ТрО0Т ТОР = 
Файл Раѕѕма 
Имя Логин Офис Ша біс Каталог 


Ғогтаї $ТБОЧТ = 
@<<<<<<<<<<<<<<<<<< Ө @<<<<<<@>>>> @>>>> @<<<<<<<<<<<<<<<<< 


фпапе, $1обіп, $оғғісе, $и19, $919, ФНоме 


# отчет по бланку сообщения об ошибке 
Тогмат 5ТрО0Т ТОР = 
Сообщение об ошибке 
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@<<<<<<<<<<<<<<<<<<<<<<< @| | | @>>>>>>>>>>>>>>>>>>>>>>> 
$зузтет, $%, $дате 


Гогтаф ЭТООИТ = 
Сообщение: в<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< 
$ѕибјесї 
Индекс: Ө<<<<<<<<С<<<<<<<<сккС<<<<4 7<<<<<<<<<<<<<<<<<<<<<<<<<<< 
$1пдех, $деѕсгіртіоп 
Приоритет: @<<<<<<<<<< Дата: @<<<<<<< 7<<<<<<<<<<<<<<<<<<<<<<<<<<< 


фргіогіту, $дате, $Чезсгаре1оп 
От: @<<<<<<<<<<<<<<<<<<<<<<<<<<<<< 2<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< 
$Егот, $0еѕсгіртіоп 
Предназначено" @<<<<<<<<<<<<<<<<<<<<<< 7<<<<<<<<<<<<<<<<<<<<<<<<<< 
$ргодгаттег, $деѕсгірііоп 
- 2<<<<<<<<<<<<<<<<<<<<<<<<<<<< 
$деѕсгірііоп 
- ^<<<<<<<<<<<<<<<<<<<<<<<<<<<< 


$дезсгарЕ1оп 

- 2<<<<<<<<<<<<<<<<<<<<<<<<<<<< 
$деѕсгірііоп 

- 72<<<<<<<<<<<<<<<<<<<<<<<<<<<< 
$деѕсгірїіоп 

- 2<<<<<<<<<<<<<<<<<<<<<<<... 
$деѕсгіртіоп 


Лексические переменные не видны в формате, если только объявление формата 
не находится в области видимости лексической переменной. 


Можно чередовать применение ргіпї и мгіїе в одном и том же канале вывода, но 
придется самостоятельно обрабатывать специальную переменную $- ($ЕОВМАТ_ 
ЕТМЕЗ ІЕҒТ, если используется модуль Еп01151). 


Переменные форматов 


Имя текущего формата хранится в переменной $- ($ФРОВМАТ_МАМЕ), а имя текущего 
формата начала страницы - в переменной $^ ($ҒОАМАТ ТОР МАМЕ). Номер текущей 
выводимой страницы хранится в $% (ФРОВМАТ РАСЕ_МИМВЕН), а число строк на страни- 
це - в $-= (ФРОВМАТ І ІМЕЅ РЕА РАСЕ). Необходимость автоматической очистки буфера 
этого дескриптора определяется переменной $| ($00ТРИТ_АЧТОЕЦУЗН). Строка, кото- 
рую нужно выводить перед началом каждой страницы (кроме первой), хранится 
в $1 (ФҒОВМАТ РОВМЕЕЕД). Эти переменные устанавливаются отдельно для каждого 
дескриптора файла, поэтому, чтобы изменить переменные его формата, нужно 
сначала выбрать дескриптор файла с помощью ѕе1есі: 


зе1ест( (зе1ест(0ЦТЕ), 
$- = "Му ОТВег_Рогтат” 
$^ = “Му Тор _Рогта+” 
2101); 


Довольно безобразно, не так ли? Однако это общепринятая идиома, поэтому не 
удивляйтесь, увидев ее. Можно использовать временную переменную для хране- 
ния предыдущего дескриптора файла: 
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фоғһ = ѕеІесї(О0ТЕ); 
$- = "Му Отһег_Еогтаї” 
$7 = “Му Тор _Рогтаї”; 
эе1ест ($0#һ); 


В целом такой подход гораздо лучше, поскольку он не только улучшает читае- 
мость, но и создает промежуточную инструкцию в коде, на которой происходит 
остановка при отладке в пошаговом режиме. При использовании модуля Епо1іѕћ 
имена переменных даже становятся понятными: 


иѕе Епд11$1; 
фоғћ = ѕе1ес+(О0ТЕ); 


$РОВМАТ МАМЕ = "Му Оїћег_Рогтаї" 
$РОВМАТ_ТОР_МАМЕ = “Му_Тор_Рогта{”; 
ѕе1есі($оғһ); 


Но курьезные вызовы $61есї все же никуда не исчезли. Чтобы избежать их, вос- 
пользуйтесь модулем І10::Напй1е, поставляемым с Рен. В этом случае обращаться 
к специальным переменным можно с помощью методов, в именах которых ис- 
пользуются буквы нижнего регистра: 


иѕе ТО: :Напа1е; 
ООТЕ->#огтаї_пате( "Му _Отһег_Еогтаї" ); 
ОИТЕ->Рогтат_Тор_пате(”Му_Тор_Рогтат”); 


Так гораздо лучше! 


Поскольку в строке значений, следующей за строкой шаблона, могут содержать- 
ся произвольные выражения (для полей типа 6, но не полей `), можно передать 
более сложную обработку другим функциям, скажем, ѕргіпїѓ или своим собст- 
венным. Например, чтобы вставить в число запятые: 


Ғогтаї Тдепе = 
@<<<<<<<<<<<<<<< 
сотті#у($п) 


А чтобы вставить в поле фактические символы 6, - или 7, сделайте так: 


Ғогтаї Ідепі = 
Я поместил @ сюда 
“в” 


Для выравнивания по центру всей строки текста надо сделать примерно ниже- 
следующее: 


Ғогтаї Ідепі = 
ФТТ 


"Какой-то текст” 


Индикатор длины поля > обеспечивает выравнивание текста по правому краю по- 
ля, но само поле располагается в точности там, где это указано. Нет прямого спо- 
соба: «переместить поле к правому краю страницы, какой бы широкой она ни 
была». Необходимо указать, где оно должно находиться относительно левого 
края. Те, кому это крайне необходимо, могут создать формат динамически, задав 
действительное число колонок, а затем выполнить его через ема: 
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$Ғо ваї = “Рогтаф ЗТОООТ = \п” 
тех $0018 . “\л" 


Фепегу" — “\п" 
\е- "С х ($0013-8) “--\а" 

. Фепїгу “п” 

П: 


ргіп ФҒогта+ іғ $0е6и991п9; 
еуа1 $Ғогтаї; 
діе $0 11 $6; 


Самой важной строкой здесь, вероятно, является ргіпі. Результат вывода ргіпї 
может выглядеть следующим образом: 


Ғогта ЭТООЦТ = 
«<<< «««<<««««<«<<«<<<«<<«<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< 


$епїгу 
ПК «<<< «<<< «<«<<<«<<<«<<<<<<<<<<<<«<<<-- 


$епїігу 


Вот маленькая программа, которая работает подобно утилите ОМТХ ѓті(1): 


Ғогтаї = 
2«<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< ~ 


$ 


$/ ="; 
пе (<>) { 
$/\з*\п\5*/ /9; 


мгіте; 


Нижние колонтитулы 


В то время как имя текущего формата заголовка хранится в переменной $” 
(ФЕОАМАТ ТОР МАМЕ), соответствующего механизма для нижнего колонтитула нет. 
Одна из главных проблем заключается в том, что размер формата не известен до 
тех пор, пока он не обработан. Эта задача — в нашем списке ТОРО. 


Можно предложить такую стратегию: если нижний колонтитул имеет фиксиро- 
ванный размер, то выводить его, проверяя число оставшихся в формате строк 
$- (ФЕОВМАТ 1 ТМЕЗ_1ЕЕТ) перед каждой операцией мгіїе, и при необходимости само- 
стоятельно выводить нижний колонтитул. 


Вот другая стратегия: откройте канал с помощью ореп(МЕЗЕСЕ, “|-”) (см. описание 
ореп в главе 27) и всегда выполняйте иг1їе в МЕЗЕТЕ вместо 510007. Затем пусть ваш 
дочерний процесс обработает свой ЭТОТМ и переставит верхние и нижние колонти- 
тулы так, как вам хочется. Не очень удобно, но реализуемо. 


' Что, конечно, не гарантирует, что мы когда-нибудь это сделаем. Форматы являются от- 


части пройденным этапом в наш век \/\У/, Юникода, ХМЕ, ХЗГТ и неизбежно надви- 
гающегося будущего. 
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Низкоуровневый доступ к форматированию 


Для низкоуровневого доступа к механизму форматирования можно использовать 
встроенный оператор Гогп11пе и обратиться к $`А (переменная ФАССИМИГАТОВ) непо- 
средственно. Форматы, в сущности, компилируются в последовательность вызо- 
вов ѓогт1іге.) Например: 


фзіг = Ғогтііпе <<'Е№О’ 1.2,3; 
@<<< @||| «>> 
ЕМО 


ѕау "Вау, я запомнил '$^А’ в аккумулятор!" 


Чтобы создать подпрограмму ѕигіїе (парную для мг1те, как зргаптР для рг1пт#?), 
сделайте следующее: 


оиѕе Сагр; 
500 5мгіте { 
сгоак "Порядок использования ѕмгіїе РІСТОЋЕ АВОЅ” оп1еуу @ ; 
ту ФГогмаф = ѕһіғі; 
ф^А = ""; 
Ғогт11пе($тогтаї, @_); 
гетигп $7А: 


} 


фоігіпод = зми1те(<< ЕМО. 1. 2. 3): 
Свеск пе оџї 

@<<< @||| @ә>> 

ЕМО 

ргіпі $5ігіпо, 


Если используется модуль 10::Напа1е, с помощью ѓогпііпе можно организовать пе- 
ренос блоков текста по колонке 72: 


иѕе Ғі1еНапа1е; 
ТОООТ ->ғогт1іпе("^ ("< х 72) “--\п”, $10п9 +ехї), 


А теперь приготовьтесь к изучению большой главы... 
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Функции 


В этой главе описываются встроенные функции Рег в алфавитном порядке, 
обеспечивающем удобство доступа к справочной информации. Описание каждой 
функции начинается краткой сводкой ее синтаксиса. Имена параметров, такие 
как ТНІ5, представляют фактические выражения, а текст, следующий за синтак- 
сической сводкой, описывает семантику применения фактических аргументов. 


Функции, наряду с литералами и переменными, можно считать термами выра- 
жения либо префиксными операторами, которые обрабатывают аргументы, сле- 
дующие за ними. В половине случаев мы функции так и называем — операторами. 


Некоторые операторы (т. е. функции) принимают в качестве аргумента / 157 (спи- 
сок). Элементы списка / 157 должны разделяться запятыми (или оператором =>, 
причудливым вариантом запятой). Элементы списка вычисляются в списочном 
контексте, поэтому каждый элемент возвращает скалярное или списочное значе- 
ние, в зависимости от своей чувствительности к списочному контексту. Каждое 
вычисленное значение, будь оно скаляром или списком, интерполируется как 
часть общей последовательности скалярных значений. Проще говоря, все списки 
объединяются в один плоский список. С точки зрения функции, получающей ар- 
гументы, общий аргумент [157 всегда является одномерным списком. (Чтобы ин- 
терполировать массив как один элемент, необходимо явно создать и интерполи- 
ровать ссылку на массив.) 


Аргументы предопределенных функций Рег! можно заключать или не заключать 
в круглые скобки, но в синтаксических сводках данной главы скобки опущены. 
При использовании скобок применяется простое правило, вызывающее, время от 
времени, удивление: если нечто выглядит как функция, это и есть функция, по- 
этому приоритет не имеет значения. В противном случае это списочный или унар- 
ный оператор, и приоритет имеет значение. Будьте осторожны, поскольку даже 


1 Иногда тесно связанные между собой функции объединены на страницах руководства, 
и мы придерживаемся здесь такой же группировки. Например, чтобы найти описание 
епдрмепї, придется смотреть деїрмепї. 
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если между ключевым словом и левой скобкой поместить пробельный символ, 
такая конструкция все равно останется вызовом функции: 


ргіпі 1+2*4; # выведе, 9. 
ргіпі( 1+2) + 4; # выведет 3! 
ргіпі (1+2) :4, # Тоже выведет 3! 
ргіпі +(1+2)*4; # выведет 12. 
ргіпі ((1+2)*4); # выведет 12. 


Если запустить Рег! с ключом -ш, подобный код приведет к предупреждению. На- 
пример, вторая и третья строки из примера выше порождают такие сообщения: 


ргіпі (...) 1птегргетед аз Ғипсїіоп аї - ііпе 2 

Џѕе1еѕ5 изе оѓ іпіедєг ти1+ір1іса+іоп іп уоід соптехт ат - 1іпе 2. 

[ргіпї (...) интерпретируется как функция - в строке 2 

Бессмысленное использование умножения целых в пустом контексте - в строке 2] 


Учитывая простоту определения некоторых функций, программисту предостав- 
ляется значительная свобода в способе передачи аргументов. Например, самый 
распространенный способ вызова сһпой состоит в передаче прав доступа к файлу 
(т.е. режима) в первом аргументе: 


сһтод 0644, @аггау; 


но в определении сһтой просто сказано: 
сһтод [757 


поэтому с таким же успехом можно сказать; 


Опћ1тТ баггау, 0644: 
сһпод @аггау; 


Если первый аргумент списка не является допустимым режимом, вызов сһптоєс за- 
вершается неудачей, но это — семантическая проблема этапа выполнения, не свя- 
занная с синтаксисом вызова. Если семантика требует передачи каких-либо спе 
циальных аргументов во главе списка, эти ограничения будут описаны в тексте. 


В противоположность простым функциям, принимающим список / 157, другие 
функции налагают дополнительные синтаксические ограничения. Например, для 
риѕћ синтаксически правильным является такой вызов: 


риѕћ ААЛАУ, [ІТ 


Это означает, что риѕћ ожидает получить действительный массив в первом аргу- 
менте, но безразлична к следующим аргументам. Вот что означает / 157 в конце. 
(Списки всегда идут в конце, так как они «съедают» все оставшиеся значения.) 
Если в синтаксической сводке есть аргументы, предшествующие / 157, они син- 
таксически различаются компилятором, а не просто семантически различаются 
интерпретатором при его последующем выполнении. Такие аргументы никогда 
не вычисляются в списочном контексте. Они могут вычисляться в скалярном 
контексте или быть особыми ссылочными аргументами, как массив для вызова 
риѕћ. (В описаниях функций мы рассказываем, где что.) 


Для операций, основанных непосредственно на функциях библиотеки С, мы не 
стали дублировать системную документацию. Если в описании Ёџпсїіоп предла- 
гается обратиться к ѓипсііоп(2), следует найти С-версию этой функции, чтобы 
больше узнать о ее семантике. Число в скобках указывает на раздел в руководстве 
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системного программиста, содержащий нужную страницу руководства, если 
в системе установлено руководство (тап райез). (Или не содержащий, если руко- 
водство не установлено.) 


Эти страницы руководства могут описывать системо-зависимые функции — та- 
кие, например, как теневые файлы паролей, списки управления доступом и т.д. 
Многие функции Регі, являющиеся производными от библиотечных функций С 
в ОМІХ, эмулируются даже на других платформах. Например, операционная сис- 
тема может не поддерживать системные вызовы {[0сЁ(2) или [огЁ(2); тем не менее, 
Рей постарается эмулировать их с использованием тех средств, которые предос- 
тавляет данная платформа. 


Иногда оказывается, что документированная функция С принимает больше ар- 
гументов, чем соответствующая функция Регі. Обычно отсутствующие аргумен- 
ты - это то, что Ре! уже известно, например, длина предыдущего аргумента, по- 
этому передавать такие аргументы в Рег] не требуется. Все остальные несоответ- 
ствия обусловлены различиями в представлении дескрипторов файлов и значе- 
ний кодов завершения в Реп и С. 


В общем случае функции Ре, служащие обертками одноименных системных 
вызовов (например, сһошп(2), {огЁ(2), сіоѕейіг(2) и т.д.), возвращают истинное зна- 
чение при успехе и ипдеГ в противном случае, на что указывают описания этой 
главы. В этом – их отличие от соответствующих интерфейсов библиотеки С, кото- 
рые всегда возвращают -1 при неудаче. Исключениями из этого правила являют- 
ся маії, маіїріа и ѕуѕса11. Системные вызовы при неудаче также устанавливают 
специальную переменную $! ($05_ЕВАОН). Прочие функции этого не делают, разве 
что случайно. 


Для функций, которые могут использоваться как в скалярном, так и в списочном 
контекстах, неудача в скалярном контексте часто обозначается ложным значени- 
ем (обычно ипіе?), а в списочном контексте — пустым списком. На успешное вы- 
полнение обычно указывает возвращаемое значение, которое вычисляется как 
истинное (в контексте). 


Запомните следующее правило: нет правила, связывающего характер поведения 
функции в списочном контексте с ее поведением в скалярном контексте. и наобо- 
рот. Это поведение может значительно различаться. 


Каждая функция знает, в каком вызвана контексте. Одна и та же функция воз- 
вращает список в списочном контексте, и значение наиболее подходящего типа — 
в скалярном контексте. Некоторые функции в скалярном контексте возвращают 
длину списка, который вернули бы в списочном контексте. Некоторые операторы 
возвращают первое значение в списке. Некоторые функции возвращают послед- 
нее значение в списке. Какие-то функции возвращают «другое» значение, когда 
нечто можно искать либо по номеру, либо по имени. Некоторые функции возвра- 
щают число успешных операций. В целом функции Ре! делают в точности то, 
что вам нужно, если только вам не нужно единообразие. 


Одно заключительное замечание: мы постарались быть последовательными в ис- 
пользовании терминов «байт» и «символ». Исторически эти термины всегда смеши- 
вались. Когда мы говорим «байт», то всегда подразумеваем восьмибитный символ. 
Когда мы говорим «символ», то подразумеваем абстрактный код Юникода. Это то, 
что программисты на С обычно хранили в своих переменных типа спаг, пока их раз- 
мера хватало. В наши дни новым типом спаг стал тип іпі. Код символа Юникода — 
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это видимый программисту символ, неотрицательное целое число, соответствую- 
щее единственной сущности Юникода, иногда неформально называемой символом. 


В настоящее время лишь несколько функций, не входящих в библиотеку под- 
держки регулярных выражений, имеют непосредственное отношение к графе- 
мам, но они образуют следующий уровень абстракции над кодами символов. Они 
являются видимыми пользователю символами, и могут, в свою очередь, включать 
символы, видимые программистами. Последовательность СВЕ является при- 
мером графемы, состоящей из двух кодов. Другим хорошим примером является 
графема б, которая в разных ситуациях может занимать от 1 до 3 кодов, в зависи- 
мости от нормализации: \х{220} в МЕС, \х{6Е}\х{303}\х{304} в МЕР” или \х{Е5}\х{304) 
без нормализации. Поэтому, когда в этой главе мы говорим о символах, на самом 
деле мы подразумеваем коды символов, а если говорим о байтах, подразумеваем 
обычные, не декодируемые порядковые значения от 0 до 255. 


Функции Регі по категориям 


Вот функции Рей и ключевые слова, похожие на функции, разбитые на катего- 
рии. Некоторые функции входят в несколько разделов. 


Обработка скаляров 


сһотр, спор, сһг, сгур*, Рс, һех, 1пдех, 1с, ІсҒігѕї, Іепоїћ, осї, ога, раск, 9//, 99// 
геуегзе, глпдех, ѕргіпїт, ѕибѕїг, 1г///, ис, исѓігеї, у/// 


Регулярные выражения и поиск по шаблону 

п//, роз, аг//, диотетета, 5///, 5р111, ѕїибу 
Числовые функции 

аб, аїап2, соѕ, ехр, һех, 111, 109, осї, гапа, ѕіп, 59гї, ѕгапа 
Обработка массивов 

рор, риѕћ, ВТ, ѕр1ісе, ипзћіѓт 


В Рей версии у5.12 появилась возможность применять функции еасп, кеу» 
и уа1иез к массивам, если потребуется. 


Обработка списков 

дгер, јоіп, тар, дм//, геуегѕе, ѕогі, ипраск 
Обработка хешей 

де1ете, вас, ех1${$, кеуз, уа1иеѕ 
Ввод и вывод 


ріптоде, с105е, с1озед1г, абтс1о$е, Чбтореп, д1іе, еої, #11епо, Ғ1оскК, Гогтат, аетс, ргіпі, 
рип геаа, геайдіг, гвадріре, “еміпддіг, ѕау, ѕеек, ѕеекаіг, ѕе1есї (готовые дескрип- 
торы файлов), ѕуѕса11, ѕуѕгеай, ѕуѕѕеек, ѕуѕигіте, те11, те1141г, їгипсаїе, магп, ми Ме 


Данные фиксированной длины и записи 
раск, геад, ѕуѕса11, зузгеад, зуззеек, зузиг Те, ипраск, мес 
Дескрипторы файлов, файлы и каталоги 


-Х, сһаіг, сһтоа, сһомп, сһгоої, Рспт1, 9106, 1іосТ1, 11пк, 151аї, ткаіг, ореп, орепа1г, 
геад1іпк, гепате, гтііг, ѕе1есї (готовые дескрипторы файлов), зе1ест (дескрип- 
тор выходного файла), ѕїаї, ѕутііпк, зузореп, итазк, ип1іпк, и 1те 
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Управление последовательностью выполнения команд 


са11ег, сопїіпие, 91е, до, дитр, еуа1, ехії, __РТЕЕ__, доїо, 1азф, _ 11МЕ__, пехї, 
_ _РАСКАСЕ__, гедо, гефигп, $00, маптаггау 


Области видимости 
са11ег, 1трогт, 1оса1, пу, по, оиг, раскаде, ѕїате, изе 


Ѕіаѓе доступна, только если включена особенность “ѕїаїе" или если она вызы- 
вается с префиксом СОВЕ::. См. описание Геатиге. Эту функцию можно также 
включить в текущую область видимости директивой изе \5.10 или с более вы- 
соким номером версии. 


зуійсћ 
ргеак, сопі1пие, деғаџ1т, д1уеп, мпеп 


За исключением соптіпие, служащего выражением, а не блоком, эти ключевые 
слова становятся доступны только после включения "ѕміїсћ". Тот же эффект 
дает включение в текущую область видимости директивы иѕе \5.10 или с более 
высоким номером версии. См. раздел «Оператор &1уеп» в главе 4. 


Разное 
беғіпеа, дитр, ема1, Ғогт1іпе, 10ск, ргоїотуре, геѕеї, ѕса1аг, ипае?, маптаггау 
Процессы и группы процессов 


а1агт, ехес, Ғогк, деїрогр, деїрріа, деїргіогіту, кі11, ріре, ах//, ѕеїрогр, ѕеїргіогіту, 
ѕ1еер, зузТет, їітеѕ, маії, маіїріа 


Библиотечные модули 

00, 1прогї, по, раскаде, гедиіге, изе 
Классы и объекты 

р1е55, йбтс1оѕе, дбтореп, раскаде, ге?, {1е, їіед, иптле, иѕе 
Низкоуровневый доступ к сокетам 


ассерї, біпа, соппесї, деїреегпате, деїѕоскпате, деїѕоскорї, ііѕїеп, гесу, ѕепд, 
ѕетѕоскорї, ѕһиїаомп, ѕоскеї, ѕоскеїраіг 


Межпроцессные взаимодействия в Ѕуѕіет У 
п50с11, пѕ90деї, тѕдгсу, тљдѕпа, ѕетс+1, зетдет, зетор, ѕћтс+1, зтдет, ѕһтгеага, ѕһтмгіїте 
Получение информации о пользователях и группах 


епадгепт, епдпозтепт, епапетепі, епдрмепі, детдгепт, деїдго1а, деїдгпат, деї10діп, 
деїрмепі, деїрмпат, детрми19, ѕеїдгепі, ѕеїрмепї 


Получение информации о сети 


епаргоёоепі, епазегуепт, детрозтоуаЧаг, одетпоѕірупате, деїћоѕїепї, дегпеёбуаааг, 
деіпеїрупапе, деспетепї, детргоїтобупапе, деїрготорупитбег, детргоїоепт, деїѕегубупате, 
детзегубурогт, деїѕегуепї, ѕеїћоѕїепї, зетпетепт, ѕеїргоїоепї, ѕеїѕегуепі 


Время 
оптіпе, Іоса1ііпе, іме, їітеѕ 
Функции, имеющие отношение к Юникоду 


ріптоде, сһотр, спор, сһг, дртореп, їс, деїс, 1пдех, 1С, ІСТігѕї, Іепоїћ, т//, ту, ореп, 
ога, сиг, раск, раскаде, роз, ргіпї, ргіпї?, оџоѓете+а, геаа, геад1іпе, геуегзе, г1паех, 
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5///, ѕеек, ѕогї, 5р1ії, ѕргіпі?, зтате, ѕибѕіг, ѕуѕореп, зузгеад, ѕуѕѕеек, зуѕмгіїе, 
те11, 1г///, їгипсаїе, ис, исРігѕї, ипраск, мгіїе, у/// 


Функции Регі в алфавитном порядке 


Многие из последующих имен функций аннотированы значками. Вот их значение: 


ра Использует $_ ($АВб) в качестве переменной по умолчанию. 


| $ Устанавливает $! ($05 ЕАКОВ) при ошибках системных вызовов. 

22. 

50) Возбуждает исключение; используйте еуа1 для перехвата $@ (ФЕМАІ ЕЯНОВ). 
Я Устанавливает $? ($СНТЕВ_ЕВНОВ) при выходе из порожденного процесса. 


Т Делает возвращаемые данные мечеными. 


| Т | Делает возвращаемые данные мечеными при некоторых системных, нацио- 
нальных настройках или настройках дескрипторов. 


У ` 
двс Возбуждает исключение при получении аргумента недопустимого типа. 


1 Возбуждает исключение при модификации объекта, доступного только для 
' чтения. 


Возбуждает исключение при получении меченых данных. 
Возбуждает исключение, если не реализована на данной платформе. 


МА, Возбуждает исключение, если передается строка, содержащая символы с по- 
С рядковыми значениями больше 255. 

Функции, возвращающие меченые данные, получив меченые данные на входе, 
особо не выделены, поскольку так поступает большинство функций. В частно- 
сти, любая функция, которая применяется к %Е№\ или @АНС\, возвращает меченые 


данные. 


‚© 
Функции, отмеченные значком |А, возбуждают исключение, когда ожидают по- 
лучить, но не получают аргумент определенного типа (например, дескриптор 
файла для операций ввода/вывода, ссылки для 01е5$ и т.д.). 


Функциям, отмеченным значком [о ь иногда требуется изменить свои аргумен- 
ты. Если они не могут изменить свой аргумент, из-за того, что для него установ- 
лен атрибут «только для чтения», то возбуждают исключение. Примерами пере- 
менных «только для чтения» служат специальные переменные, содержащие дан- 
ные, сохраненные при поиске по шаблону, и переменные, являющиеся псевдони- 
мами констант. 


Наличие функции со значком [8 зависит от платформы. Хотя многие такие функ- 
ции получили свои имена от функций из библиотеки С ғ ОМІХ, не следует счи- 
тать, что пользователи других платформ не могут ими пользоваться. Многие из 
этих функций эмулируются, даже те, для которых мы этого не ожидаем: напри- 
мер Гогк в системах М№іп82. Дополнительную информацию о переносимости и спе- 
цифических для системы функциях можно найти на странице руководства реп] 
рот, а также в специфической для платформы документации, поставляемой 
с версией Ре! для конкретной платформы. 
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Функции, отмеченные значком ие, возбуждают исключения, если получают не- 
декодированные строки символов, слишком больших, чтобы уместиться в один 
байт. 


Функции, возбуждающие прочие исключения, отмечаются значком $@. Это, втом 
числе, математические функции, возбуждающие ошибки диапазона аргументов, 
например $4г1{(-1). 


аБѕ ра 


абѕ МАЈЕ 
абѕ 


Возвращает абсолютное значение своего аргументг.. 
$01#Ғ = ар5($Ғігѕт - $ѕесопа) 


Здесь и в последующих примерах хороший стиль программирования (и прагма 
ѕігісї) требует добавления модификатора пу для объявления новой переменной 
с лексической областью видимости, например: 


пу $0іҒҒ = арѕ($Ғігеё - $зесопд); 


Однако для ясности мы опускаем пу в большинстве примеров. Просто считайте, 
что все такие переменные были объявлены раньше. если это вам нравится. 


2 я 
ассерї Е АЯ 51 
. ассері ЅОСКЕТ. РВОТОЅОСКЕТ 


Эту функцию используют серверные процессы, которым необходимо ожидать 
подключений клиентов через сокеты. РАОТОЗОСКЕТ ~ это дескриптор файла, уже от- 
крытый оператором ѕоскеї и привязанный к одному из сетевых адресов сервера 
или к 1МАООВ_АМУ. Выполнение приостанавливается до создания соединения, при 
этом дескриптор файла 50СКЕТ открывается и прикрепляется к вновь созданному 
соединению. Исходный РАОТОЅОСКЕТ остается без изменений; его единственное на- 
значение состоит в том, чтобы быть клонированным в действительный сокет. При 
успешном обращении функция возвращает адрес, с которым произведено соеди- 
нение, и ложное значение в противном случае. Например: 


ип1езз ($реег = ассер(50СКЕТ, РВОТОЅОСКЕТ)) { 
діе "Невозможно принять соединение: $! \п"; 


} 


В системах, где это допустимо, будет установлен флаг закрытия при ехес для вновь 
открытого дескриптора файла, если этого требует значение $ ($5Ү5ТЕМ_ ЕЮ МАХ). 


См. ассер2). См. также пример в разделе «Сокеты» главы 15. 


аіагт [т НУ 


а1агт ЕХРВ 
а1агт 


Посылает текущему процессу сигнал 516А! АМ по истечении ЕХРА секунд. 


Одновременно может быть активен только один таймер. Каждое обращение к функ- 
ции отключает предшествующий таймер. Значение ЕХРА равное 0 отключает пре- 
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дыдущий таймер без запуска нового. Функция возвращает остаток времени пре- 
дыдущего таймера. 


ргіпт “Ответь мне в течение минуты или умри: ; 

а1агт( 60); # завершить программу через минуту 
фапзиег = <ЭТОТМ>, 

$е1летеГе = а1агт(0); # сбросить таймер 

ѕау “У вас осталось $їіте1еѓ+ секунд“; 


Смешивание вызовов г1агп и $1еер обычно является ошибкой, потому что во мно- 
гих системах для реализации ѕіеер(8) используется механизм системного вызова 
аіагт(2). В более старых системах истекшее время может быть на одну секунду 
меньше заданного из-за способа подсчета секунд. Кроме того, сильно загружен- 
ная система может не сразу приступить к выполнению процесса. См. в главе 15 
сведения об обработке сигналов. 


Если требуется таймер с более высокой точностью, чем одна секунда, можно вос- 
пользоваться модулем Т1те: :Н1Вез. Многоопытные программисты могут использо- 
вать версию зе1ес{ с четырьмя аргументами (оставив три первых аргумента неоп- 
ределенными), или функцию $у3са11 для обращения к зейНтег(2), если система 
это поддерживает. 


аїап2 
аїап2 У, Х 


Возвращает главное значение арктангенса У/Х в диапазоне от -л до л. Быстро по- 
лучить приближенное значение л можно так: 


$рі = афап2(1,1) + 4; 


Для вычисления тангенсов можно обратиться к функции Тап из модуля Маїћ: Тгід 
или РОЗТХ либо просто использовать известное соотношение: 


ѕир тап { 51п($ [0]) / соѕ($_[0]) } 


Если какой-либо один или оба аргумента равны 0, возвращаемое значение зави- 
сит от реализации; за дополнительной информацией обращайтесь к своей стра- 
нице аѓап2(8) справочного руководства. 


Ыпа [ве д 
ріпа 50СКЕТ, МАМЕ 


Связывает адрес (имя) с уже открытым сокетом, заданным уже открытым де- 
скринтором файла 50СКЕТ. Возвращает истинное значение в случае успеха и лож- 
ное в противном случае. Аргумент ЛАМЕ должен быть упакованным адресом соке- 
та, имеющим надлежащий тип. 


изе Ѕоскеї; 

фрогі_питрег = 80; # допустим, мы хотим быть веб-сервером 
$зоскадаг = ѕоскадаг_іп($рогі _питбег, ІМАООВ АМҮ); 

ріпа 50СК, $зоска@аг || діе "Невозможно связать фрогі_питбег: $! ": 


См. Біпа(2). См. также примеры в разделе «Сокеты» главы 15. Обычно следует от- 
давать предпочтение выосокоуровневому интерфейсу доступа к сокетам, предос- 
тавляемому стандартным модулем 10::50скеї. 
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Бо ву 


63 птоде ЕЛЁЕЕНАМОЕЕ, ТОГАҮЕВ 
ріптоде ЕДІ ЕНАМОІ Е 


Устанавливает для дескриптора файла РГ ЕНАМОЕЕ семантику, заданную аргумен- 
том 101 АҮЕВ. Если аргумент 101 АҮЕА опущен, применнется двоичная (или гам) се- 
мантика. Если РІП ЕНАМІЕ представлен выражением, его значение принимается за 
имя дескриптора файла или ссылку нг дескриптор файла, в зависимости от об- 
стоятельств. В случае успеха функция возвращает истинное значение, в случае 
неудачи — ложное. 


Функцию біппойе нужно вызывать после ореп, но перед любыми операциями вво- 
да/вывода с дескриптором файла. Единственный способ изменить режим дескрип- 
тора файла – открыть его повторно, поскольку разные уровни Г0!1АУЕВ могут хра- 
нить разные фрагменты данных в разных буферах. Это ограничение в будущем 
может быть ослаблено. 


В прежние времена функция 01птоде применялась в основном в операционных 
системах, библиотеки времени выполнения которых различали текстовые и дво- 
ичные файлы. В таких системах біпподе служила для отключения текстовой се- 
мантики, использовавшейсн по умолчанию. Однако с приходом Юникода все про- 
граммы во всех системах должны каким-то образом проводить это различие. 


В наше время есть только один тип двоичного файла (если говорить о Рег), но 
много типов текстовых файлов, которые тоже было бы желательно обрабатывать 
в Ре] единым способом. Поэтому в Рей есть единственный внутренний формат 
представления текста Юникода: ОТЕ-8. 


Поскольку существует много типов текстовых файлов, при вводе часто требуется 
транслировать текстовые файлы в ОТЕ-8, а при выводе в какой-либо из унаследо- 
ванных наборов символов или в другое представление Юникода. 


Посредством фильтров ввода/вывода можно сообщить Рей, как точно (или не точ- 
но) осуществлять такие переводы. Например, фильтр `:їехі указывает на необ- 
ходимость обработки текста вообще, без уточнения. какого рода текст обрабаты- 
вается. 


Но такие фильтры ввода/вывода, как 1118” и “:епсод1п9(1а11п1)", указывают, 
в каком формате производить чтение и запись текста. 


С другой стороны, фильтры ввода/вывода вроде “:гаи запрещают Ре! трогать 
данные своими «шаловливыми ручками». 


Подробнее о том, как работают (или будут работать) фильтры ввода/вывода, мы 
рассказываем в описании функции ореп. Оставшаяся часть данного изложения 
посвящена действиям ріпподе в отсутствие аргумента ТОГАУЕЙ, т.е. историческому 
значению біпподе, которое эквивалентно: 


Ббіптоде РІГЕНАМОЃЕ, “:гам”, 


Если не указано другое, Ре] предполагает, что вновь открытый файл нужно чи- 
тать и писать в текстовом режиме. Текстовый режим означает, что внутренним 
указателем конца строки будет \п (перевод строки). Все системы используют \п 
в качестве внутреннего указателя конца строки, но его действительное представ- 
ление различается от системы к системе, устройства к устройству и даже от фай- 
ла к файлу, в зависимости от способа обращения к файлу. В старых системах 
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(включая М5-005 и УМ5) то, что программа видит как \п, может быть не тем, что 
физически хранится на диске. Операционная система способна сохранять тексто- 
вые файлы с последовательностями \СМ\сЈ, которые транслируются при вводе 
и представляются программе как \п, а \п при выводе из программы в файл транс- 
лируются в \сМ\сЈ. Функция 61птоде отключает эту автоматическую трансляцию 
в таких системах. 


В отсутствие аргумента ТОЕЛУЕВ функция біпподе не оказывает никакого действия 
в ОМХ (включая Мас ОБ Х), где \п служит для обозначения конца каждой строки 
и представляется одним символом. (Однако это могут быть разные символы: ОМІХ 
использует \с., а старые Маки – \сМ. Все это не имеет значения.) 


В следующем примере показано, как сценарий Ре! может прочесть изображение 
в формате СТЕ из файла и вывести его на стандартное устройство вывода. В систе- 
мах, которые переводят буквальные данные в нечто отличное от их точного физи- 
ческого представления, необходимо настроить оба дескриптора. Хотя можно ис- 
пользовать фильтр `:гам" напрямую при открытии СТЕ, не получится так просто 
сделать это для предварительно открытых дескрипторов файлов вроде 570007: 


біптоде($ТОО0Т, “: гам”) 
|| діє “невозможно применить фильтр гам к 5ТООЦТ: $!" 
ореп(бТЕ, "< :гам”, “ула-ромег. 91”) 
|| 91е "невозможно открыть уіт-ромег. дії: $!”; 
мһі1е (геаа(отЕ, $0иғ, 1024)) { # теперь байты, а не символы 
ргіпі 5Т0ОЏТ $6ие; 
} 


Обратите внимание, что при использовании встроенного фильтра ОТЕ-8: 
біптоде(НАМОІЕ, ":иЕ#8"): 


если НАМЕ является дескриптором входного файла, вы должны быть готовы 
вручную обрабатывать ошибки кодирования, потому что, начиная с версии у5.14, 
механизм по умолчанию слишком либерально относится к неправильным кодам 
ОТЕ-8. Самый простой и лучший способ обработки ошибок кодирования состоит 
в том, чтобы вообще не пропускать их. 


изе магп1ид$ РАТАЁ => “и{Р8”: 
Даже если вы задействуете модуль Епсоде, как показано ниже: 
Ь1птоде(НАМОЕЕ, " : епсодіпо(иї?8)") 


все равно следует сделать предупреждения ОТЕ-8 фатальными, как показано вы- 
ше, потому что иначе вы не будете получать исключения в случае появления 
ошибок. (Исключения всегда предпочтительнее искаженного текста. Такой текст 
все равно не сделает вас счастливыми.) 


Ыеѕѕ А 
б1еѕѕ ЯЕ, СІАЅЅМАМЕ 
р1еѕѕ ВЕЕР 


Эта функция сообщает объекту ссылки, на который указывает ссылка ПЕР, что 
с этих пор он является объектом в пакете СГ АЅ5МАМЕ — или текущем пакете, если 
имя класса С1А5МАМЕ не задано. Если АЕЁ не является действующей ссылкой, воз- 
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буждается исключение. Для удобства 01655 возвращает ссылку, так как часто это 
последний вызов в подпрограмме-консгрукторе. Например: 


$реї = Веаѕї->пем(ТҮРЕ => “соидаг” МАМЕ => “С1уде“); 


# далее в Веаѕт. рп: 


ѕир пем { 
ту $с1а55 = ѕһі?ї; 
пу Хаїїг5 = @ ; 
ту $зе1е = { Жаїїгѕ }; 


гетигп 01е55($ѕе1#, $с1аз$); 
} 


Как правило, следует «освящать» объекты в классы, имена которых имеют сме- 
шанный регистр. Пространства имен с именами в нижнем регистре зарезервиро- 
ваны для внутреннего использования в качестве прагм Ре! (директив компиля- 
тора). Имена встроенных типов (например, ЭСАГАВ, АВВАУ, НАЗН и т.д., не говоря уже 
о базовом классе всех классов ИМТУЕНЗА!) составлены из символов верхнего регист- 
ра, поэтому таких имен тоже желательно избегать. 


Аргумент С1АЗЗМАМЕ не должен быть ложным значением; «освящение» в ложные 
пакеты не поддерживается и может приводить к непредсказуемым результатам. 


Отсутствие парного оператора сигзе (проклятие) ошибкой не является; зато у нас 
есть оператор ѕіп (грех). См. также главу 12, где подробнее рассказано об освяще- 
нии (и благодеяниях) объектов. 


БгеаК 


Бгеак 


Осуществляет преждевременный (до окончания предложения мћеп) выход из бло- 
ка діуеп. Поддержка этого ключевого слова включается особенностью ѕміїсі; 
см. описание прагмы Геафиге в главе 29. 


саЙег 


са ег ЕХРЯ 
саПег 


Возвращает сведения о стеке вызовов текущей подпрограммы и сопутствующую 
информацию. При вызове без аргумента возвращает имя пакета, имя файла и но- 
мер строки, из которой была вызвана подпрограмма. выполняемая в данный мс- 
мент: 


(Фраскаде, $Ғі1епате, $11пе) = са11ег; 


Вот пример исключительно привередливой функции, использующей специаль- 
ные лексемы __РАСКАСЕ _ и _ ҒПЕ__, описываемые в главе 2: 


ѕир саге?иї { 
ту (Фраскаде, $#і1епате) = са11ег; 
џп1еѕѕ ($раскаде ед __РАСКАСЕ _ && $111епате ед __ЕШЕ__) { 
ӧіе "Ты не должен был вызывать меня, $раскаде! \п” 
} 


зау “свободно вызвал меня” 
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зиб ѕағеса11 { 
саге?и1(), 
} 


При вызове с аргументом функция са11ег интерпретирует ЕХРА как количествс 
кадров стека, на которое надо вернуться назад от текущего. Например, аргумент 0 
означает текущий кадр стека, 1 означает кадр стека вызвавшей подпрограммы, 
2 означает кадр стека подпрограммы, вызвавшей вызвавшую, и т.д. Функция 
возвращает также дополнительную информацию, как показано ниже: 


пу $1 = 0; 

мһі1е (ту ($раскаде, $Е11епате, $1іпе, $зибгош але, 
$һаѕагдѕ, $мапфаггау, $еуа1техі, $іѕ гедиіге, 
$піпев, $біттаѕк, Фһіпіһаѕћ) = са11ег($1++) ) 


} 


Если кадр стека представляет вызов подпрограммы, $ћаѕагоѕ принимает истинное 
значение, если имеется собственный массив @_ (не заимствованный у вызвавшей 
подпрограммы). В противном случае $$00гоџіпе может иметь значение “(е\а1)", 
если кадр является не вызовом подпрограммы, а ема]. В этом случае устанавлива- 
ются дополнительные элементы $еуа{ех+{ и $15 гедиіге: $15 гедиіге принимает ис- 
тинное значение, если кадр создан командой гедиіге или ие, а $еуа1їехї содержит 
текст команды еуа1 ЕХРА. В частности, для команды еуа1 ВОСК элемент $11] епате 
есть "(еуа1)”, а $еуа{ехх не определена. (Обратите также внимание, что каждая 
инструкция ие создает кадр гедиіге внутри кадра еуа1 ЕХРА.) Элементы $1115, 
Фоіїтаѕк и $ћіпіһаѕћ представляют собой внутренние значения: пожалуйста, ис- 
пользуйте их, только если принадлежите к элите чудотворцев.! 


В качестве еще более сильного волшебства са11ег также заполняет массив @[В: :аг93 
аргументами, переданными в данном кадре стека, но только при вызове из паке- 
та ВВ. См. главу 18. 


Имейте в виду, что оптимизатор может оптимизировать кадры стека вызовов еще 
до того, как са11ег получит шанс извлечь информацию. Это означает, что вызов 
са11ег(№) может не вернуть информацию о кадрах стека вызовов для / > 1. В част- 
ности, @0В::агдз может хранить информацию, полученную предыдущим вызовом 
са ег. 


Также следует понимать, что установка @0В::аг9$ – это лишь попытка без гаран: 
тий; это действие возможно использовать для отладки или вывода трассиро- 
вочной информации, но не следует полагаться на информацию, хранящуюся 
в @0В::агоз. В частности, @ содержит синонимь для текущего массива @ вызы- 
вающей подпрограммы. Рей не создает копии @ при входе в подпрограмму, по- 
этому @0В::агоѕ будет отражать любые изменения, которые подпрограмма внесет 
в@ после вызова. Кроме того, @0В::агдѕ, подобно @_, не хранит явные ссылки на 


1 фһіпіћаѕһ — это ссылка на хеш, содержащий значение %`Н на момент компиляции вызы- 
вающего кода, или ипдег, если %`Н была пустой. Не изменяйте значения в этом хеше, 
так как они являются фактическими значениями, хранящимися в дереве операций. 
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свои элементы, потому в некоторых случаях его элементы могут быть освобожде- 
ны, а занимаемая ими память может быть отведена под другие переменные или 
временные значения. Наконец, текущая реализация имеет побочный эффект, ко- 
торый выражается в том, что отменить можно только 311 @ (но не рор или 
ѕр1ісе), а если была получена ссылка на@_, вы наверняка получите щелчок по но- 
су. То есть в действительности @08: :агдѕ является гибридом текущих и начальных 
значений в@_. Будьте осторожны. 


спа 


сһдіг ЕХРВ 
сћадіг 


Г 


я 01 


Изменяет текущий каталог процесса на ЕХРА, если это возможно. Если аргумент 
ЕХРВ опущен, подразумевается исходный каталог вызвавшегс процесса. Функция 
возвращает истинное значение в случае успеха и ложное в противном случае. 


спо1г "Фргеғіх/11ір || о1е “Невозможно са в $ргеѓіх/116: $!\п” 


См. также модуль Сма, который позволяет автоматически отслеживать текущий 
каталог. 


В системах, поддерживающих јсһаіг(2), ь качестве ЕХРА можно использовать де- 
скриптор файла или каталога. В системах, не поддерживающих сйай“2), переда- 
ча дескриптора вызовет исключение во время выполнения. 

сһтоа ях | 
"пт 


сһтод [157 


Изменяет права доступа для списка файлов. Первым элементом списка должен 
быть режим доступа в числовом выражении, как в системном вызове сћтоа(2). 
Функция возвращает количество успешно измененных файлов. Например, вызов 


Фспі = сһтод 0755, "#1161" "#і]е2"; 


установит $спт в 0, 1 или 2, в зависимости от того, сколько файлов было изменено. 
Успех определяется отсутствием ошибки, а не фактическим изменением, по- 
скольку файл мог иметь тот же режим до выполнения операции. Ошибка может 
означать, что у пользователя недостаточно прав на изменение режима, поскольку 
он не является владельцем файла или суперпользователем. Проверьте $!, чтобы 
выяснить фактическую причину неудачи. 


Вот более типичное применение: 


сптос(0755, вехеситаб1ез) == @ехесиїіаб1еѕ 
1191е “невозможно выполнить сһтоа для некоторых @ехесита 1ез: $! "; 


Чтобы узнать, какие файлы не удалось изменить, сделайте что-нибудь в таком 
роде: 

@саппот = дгер {пот сптоа 0755, $_} “Ее”, “#1е2”, ‘Р1е?”; 

91е "$0: невозможно выполнить сһтод для @саппої\п” і? @саппот; 


В этой идиоме используется функция огер для отбора только тех элементов спи: 
ска, для которых не удалось выполнить сһпой. 
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В системах, поддерживающих сйтоа(2), в списке аргументов можно также пере- 
давать дескрипторы файлов. В системах, не поддерживающих [сйтоа(2), переда- 
ча пескриптора файла вызовет исключение во время выполнения. Для коррект- 
ной обработки дескрипторы файлов должны передаваться как %уреё]оБз или 
ссылки на $уре1о6з: строки считаются именами файлов. 


При использовании нелитеральных значений режима может понадобиться пре- 
образовать восьмеричную строку в число с помощью функции осї. Дело в том, что 
Реп не считает строку восьмеричным числом лишь потому, что она начинается 
символом «0». 


$ОЕЕ_МОБЕ = 0644; # Здесь нельзя использовать кавычки! 
РВОМРТ { 
ргіпї “Новый режим? " 
фвїгтоде = <5ТрІМ; 
ехії ип1еѕѕ деѓіпеа $ѕ1гтоде; # проверка еоѓ 
іҒ ($51гтоде =- /7\5*$/) { # проверка пустой строки 
фтоде = $0ЕЕ МОЕ; 
} 
е151Р ($1гтойе !- /^\9+$/) { 
ѕау “Требуется числовой режим, а не $ѕ1гтойе"; 
гедо РВОМРТ; 
} 
е15е { 
фподе = осі($вїгтоде); # преобразует "755" в 0755 
} 
сһтоа $тоде, @ғ11е5; 


} 


Эта функция работает с числовыми режимами во многом подобно системному вы- 
зову ОМІХ сртод(2). Чтобы воспользоваться символьным интерфейсом вроде то- 
го, что предоставляет команда сйтоа(1), обратитесь к модулю Ее: :сИйтод в СРАМ. 


Можно также импортировать константы 5_1*» из модуля Рсп{1: 


иѕе Еспі1 ‘°:тодбе’; 
сһтоа $_ТВМХИ | 5 ІВОВР | 5_ІХСАР | $_ТВОТЕ | 5 ІХОТН, ёехесиќаб1еѕ; 


Некоторые считают, что это читается легче, чем 0755. Ну, что тут скажешь. 


сһотр Сару 
сһотр УАРТАВЕЕ 
сһотр 275Т 
сһотр 


(Как правило) удаляет замыкающий символ перевода строки из значения строко- 
вой переменной. Это несколько более безопасная версия спор (ее мы опишем ни- 
же), поскольку не изменяет строку, которая не оканчивается символом перевода 
строки. Точнее, она удаляет строку-терминатор соответственно текущему значе- 
нию $/, а не просто любой последний символ. 


В отличие от спор, функция сһопр возвращает число удаленных символов. Если 
значением $/ является "" (режим абзацев), спотр удаляет все замыкающие симво- 
лы перевода строки из указанной строки (или строк, если аргументом является 
1 19Т). В режиме поглощения ($/ = ипіе?) или в режиме обработки записей фикси- 
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рованной длины ($/ – ссылка на целое число), спотр не делает ничего. Нельзя при- 
менять сһопр к литералам — только к переменным. Если применить ее к хешам, 
будут удалены значения, но не ключи. 


Например: 


мһі1е (<РАЗЗИО>) { 
сһотр; # игнорировать \п в последнем поле 
баггау = $ѕр11іт /:/; 


} 


Фильтрам ввода/вывода разрешено переопределять значение переменной $/ и раз- 
мечать точки усечения строк. Преимущество в том, что фильтры ввода/вывода 
способны распознавать несколько видов окончаний строк (например, разделите- 
ли абзацев и строк Юникода), но, тем не менее, спотр обеспечивает безопасное уда- 
ление окончания текущей строки. 


Функция спопр в настоящее время недостаточно сообразительна, чтобы обрабаты- 
вать последовательности разрыва строк Юникода, соответствующие метасимволу 
\Н в регулярных выражениях. Обеспечить их поддержку можно таким способом: 


$3/\В/\п/д. # преобразовать все разрывы строк Юникода в \п 
Или иногда таким: 
ту брагаѕ = $р111 /\В+/, оиг $111е_ сопіепіѕ, 


Однако если необходимо сохранить последовательности разрывов строк, лучше 
использовать такой прием: 


сиг $1іпе =- $/(\8?)\2//, 
му Фсегтіпатог = $1; 


Хх] 
спор $ иво 
спор МААТАВІЕ 
спор 157 
спор 


Эта функция «обрубает» последний символ строковой переменной и возвращает 
его. Оператор спор применяется в основном для удаления символа перевода стро- 
ки в конце прочитанной записи, и работает быстрее, чем операция подстановки. 
Если это все, что вам нужно, то безопаснее применять сһопр, поскольку спор все- 
гда укорачивает строку, независимо от того, что в ней находилось; кроме того, 
сһотр более разборчива. 

Нельзя применять спор к литералам — только к переменным. Если сһор применя- 
ется к списку переменных, усекается каждая строка в списке: 


@11пез = `саї пуѓі1е`; 
спор @1іпеѕ; 


спор можно применить к любому левостороннему значению (Іуајие), в том числе 
к операции присваивания: 


сһор($сма = ‘рма `); 
спор($апзиег = <5Т0ІМ>); 
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Это не то же, что 
$апзмег = сһор($їтр = <$Т01№); # НЕВЕРНО 


где в $апѕмег сохраняется перевод строки, потому что спор возвращает «отрублен- 
ный» символ, а не оставшуюся строку (которая находится в $їпр). Один из спосо- 
бов получить предполагавшийся результат состоит в применении 3651г: 


фапзмег = ѕибѕтг <5Т0ІМ, 0, -1; 
Но чаще это записывается так: 
сһор($апѕмег = <5Т0ІМ); 
В самом общем случае спор можно выразить через зи6з{г: 


$1азф_спаг = спор($маг); 
$1аѕї сһаг = ѕибѕїг(Фуағ, -1, 1, "”); # то же самое 


Поняв эту эквивалентность, можно удалять больше одного символа. Для этого 
следует использовать ѕи0ѕїг в качестве левостороннего значения, присваивая ему 
пустую строку. Следующий код удаляет последние пять символов в $сагауап: 


ѕирѕїг($сагамап, -5) = 


Отрицательный индекс заставляет зи6зтг вести отсчет от конца строки, а не от на- 
чала. Сохранить удаленные таким способом символы можно при помощи вариан- 
та 5и031г с четырьмя аргументами, создав некий пятикратный вариант спор: 


$+а11 = зибзтг($сагамап, -5, 5, 7”); 


Все это достаточно ненадежно, ведь операции выполняются над кодами, а не гра- 
фемами. В Реп нет настоящего режима работы с графемами, поэтому вам придет: 
ся решать эту проблему самостоятельно. Возьмем в качестве примера слово 
пашее, которое в МЕР имеет вид па1\х{308}уете\х{301}. Если применить к нему 
функцию спор, вы получите не пагоеЕ, а пашее. Для отсечения графем, а не кодов, 
следует использовать $/\Х\2//. Значительную помощь во всем этом может оказать 
модуль уп1соде::0С5+гіпо из СРАМ. 


сһоууп Ге ЕЛЕ 
сһомп ЁТ 


Изменяет владельца и группу для списка файлов. Первые два элемента списка 
должны быть числовыми ОТО и СІР, причем именно в этом порядке. Значение -1 
в любой позиции интерпретируется большинством систем как указание оставить 
элемент без изменений. Функция возвращает число успешно модифипирован- 
ных файлов. Например: 


сһомп(Фи1дпит, $9лапит, “Ғі161", "#1162") == 2 
|| діе "невозможно сћомп Ғі1е1 или 111е2: $! “. 


установит $спї в 0, 1 или 2, в зависимости от того, сколько файлов было изменено 
(в смысле успеха операции, а не в смысле того, что изменился владелец). Вот бо- 
лее типичное применение: 


сһоип(Фиійпит, $оідпит, ©ғі1епатеѕ) == @ғі1епатеѕ Р 
|] діе "невозможно выполнить сһомп для @ғі1епатеѕ. $! "; 
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Следующая подпрограмма принимает имя пользователя, выясняет идентифика- 
торы пользователя и группы, а затем выполняет спомп: 


ѕир сномп_Бу_пате { 
пу(фиѕег, @111е5) =@; 
сһомп( (детрмпат($иѕег) 12,3], @Р11ез) == @ғі1еѕ 
|| діе “невозможно выполнить сһомп для @ѓі1е5: $!" 


спомп_Бу_пате(" Егей”, 9100(“*.с”)); 


Однако иногда бывает нежелательно изменять группу, как это делает предыду- 
щая функция, потому что в файле /еѓс/раѕѕша каждый пользователь ассоцииру- 
ется с единственной группой, даже при том, что пользователь может быть членом 
многих вторичных групп в соответствии с /е</&гоир. Выход в том, чтобы пере- 
дать -1 в качестве СІР, в результате чего группа не изменится. Ксли передать -1 
в качестве ОТО, а также допустимый СТО, можно установить группу, не меняя 
владельца. 


В системах, поддерживающих ѓсћошп(2), в списке аргументов можно также пере- 
давать дескрипторы файлов. В системах, не поддерживающих јсрошп(2), переда- 
ча дескрипторов файлов вызовет исключение во время выполнения. Для коррект- 
ной обработки, дескрипторы файлов должны передаваться как іуреғ1оБѕ или 
ссылки на фуреё1юБз: строки считаются именами файлов. 


В большинстве систем менять владельца файла разрешается только суперпользо- 
вателю, однако простой пользователь должен быть в состоянии изменить группу 
на любую из своих вторичных групп. В недостаточно защищенных системах эти 
ограничения могут быть ослаблены, но такое допущение ведет к созданию непе- 
реносимого кода. В РОЅІХ-системах можно определить, какое правило использу- 
ется, следующим образом: 


ие РОЅІХ ам(зузсопЕ _РС_СНОММ_ВЕЗТВТСТЕО); 
в попытаться выполнить, если сценарий выполняется от имени 
в суперпользователя или в системе с ослабленными ограничениями 
ТЕ ($> == 0 || ! ѕуѕсоп?(_ РС СНОН ВЕЅТВІСТЕО) ) { 
сһомп(Фиідпит, -1, $#і1епате) 
|| діе "невозможно сћомп $#і1епате на $иідпит: $! 


сһг [5 


сиг МЫМВЕВ 
сһг 


Возвращает символ, представленный в наборе символов числом МИМВЕВ (усечен- 
ным до целого). Например, вызов сһг(65) вернет символ «А», ГАТІХ ЗМАЫ, ГЕТТЕВ А, 
ив АЗСП, ив Юникоде, а сйг(0х2122) вернет символ <“, ТВАБЕ МАЕК 5103. Обратную 
операцию выполняет функция 010. 


Если МИМВЕВ — отрицательное число, функция вернет символ Юникода вЕРГАСЕМЕМТ 
СНАВАСТЕК, О+ЕЕЕР”.! 


1 Только в отсутствие прагмы буїеѕ, в области действия которой используются только 


младшие восемь битов значения. 
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(Имейте в виду, что символы с кодами в диапазоне от 128 до 255 внутренне не ко- 
дируются в ОТЕ-8 из соображений обратной совместимости. Вы это вряд ли заме- 
тите, но если все-таки заметите, то будете знать причину.) 


Если вы предпочитаете названия символов числам (например, “\МИНТТЕ ЗМ Тб 
РАСЕ}” для обозначения смайлика Юникода «©»), загляните в раздел «сһагпатеѕ» 
главы 29. Преобразовать код символа в его официальное название можно посред- 
ством функции сһагпатеѕ. .міасоде. 


сһгоої |$) ГЕ не 


сһћгоо ЕТЕЕМАМЕ 
Сһгоої 


При успешном выполнении функции ЕП ЕМЕ становится новым корневым ката- 
логом для текущего процесса — отправной точкой маршрутов, начинающихся ко: 
сой чертой «/». Этот каталог наследуется вызовами ехес и всеми подпроцессами, 
ответвляемыми Гогк после вызова сһгоої. Способа отменить сһгоої нет. По сообра- 
жениям безопасности эту функцию может вызывать только суперпользователь. 
Следующий код делает примерно то же, что и многие серверы ЕТР: 


сһгоо+( (дефрипат(”Рр”))[7]) 
|| де “Не разрешен анонимный Ёр: $!” 


Эта функция, скорее всего, будет работать только в системах ОМІХ. См. сћгооќ2). 


ое (999 Ае 


с1оѕе ЕТЕЕНАМОЕЕ 
с105е 


Закрывает файл, сокет или канал, связанный с дескриптором ЕПЕНАМОГЕ, предва- 
рительно вытолкнув все буферы ввода/вывода. Если аргумент опущен, закрывает 
текущий выбранный дескриптор. Возвращает истинное значение, если дескрип- 
тор файла был закрыт успешно, и ложное в противном случае. Не требуется за- 
крывать ЁЛ ЕНАМІЕ, если сразу за этим предполагается открыть его — очередной 
вызов ореп закроет дескриптор автоматически. (См. ореп.) Однако явное примене- 
ние с1оѕе для файла ввода влечет сброс счетчика строк ($.), тогда как неявное за- 
крытие с помощью ореп - нет. 


ЕП.ЕНАМІЕ может быть выражением, значение которого способно послужить кос- 
венным дескриптором файла (это будет реальное название дескриптора файла, 
либо ссылка на то, что можно интерпретировать как объект дескриптора файла) 


Если дескриптор файла получен в результате открытия канала, вызов с103е воз- 
вращает ложное значение при неудаче какого-либо из выполняющихся в нем сис- 
темных вызовов или если программа на другом конце канала заверитила работу 
с ненулевым кодом. В последнем случае с10$е устанавливает $! ($05_ЕВВОВ) в нуль. 
Поэтому, если с10ѕе для канала возвращает ненулевое значение, проверьте $!, что- 
бы выяснить, была ли проблема связана с самим каналом (ненулевое значение) или 
с программой на другом конце (нулевое значение). В любом случае $? ($СНТЕО_ЕЯВО) 
содержит значение кода ожидания (см. его интерпретацию в описании функции 
зузтет) команды, связанной с другим концом канала. Например: 
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ореп(ОЦуТРИТ, “| зогЕ -гп | 1рг -р“) # канал для ѕогї и 1рг 
|| діе “Невозможно запустить канал зог1рг: $! “; 
ргіпт ОЦТРИТ @] іпеѕ; # вывести что-то в оџїриі 
сІоѕе ОИТРИТ # ждать завершения ѕогї 
|| магп $! ? “Системная ошибка при закрытии канала ѕогї1рг $!“ 
: "Код ожидания $? от канала зогТрг“; 


Дескриптор файла, полученный в результате вызова 4ир(2) для канала, считает- 
ся обычным дескриптором файла, поэтому с105е не будет ждать завершения поро- 
жденного процесса по этому дескриптору. Ожидание следует реализовывать по- 
средством закрытия исходного дескриптора файла. Например: 


ореп(МЕТЅТАТ, "пеїѕїаї -гп |”) 

|| 91е “невозможно выполнить петзтат: $! "; 
ореп(5ТрІМ, “"<&МЕТЗТАТ”" ) 

|| 91е “невозможно выполнить дир в зідіп: $!” 


Если закрыть здесь ЭТОТ№, то ожидания нет, а если МЕТЗТАТ, то есть. 


Если каким-то образом ухитриться самостоятельно удалить завершившийся поро- 
жденный процесс, попытка закрыть канал, связывающий с ним, окажется неудач- 
ной. Это может произойти, если у вас есть собственный обработчик $510{СНі 0}, кото- 
рый запускается при завершении порожденного процесса канала, или вы намерен- 
но вызываете иа1{р19 с идентификатором процесса, полученным при вызове ореп. 


соѕеаіг [914 1 
с1оѕедіг РІАНАМІЕ 


Закрывает каталог, открытый с помощью орепо:г, и возвращает признак успеха 
операции. См. примеры в описании геад91г. Параметр ОТАНАМОЕЕ может быть выра- 
жением, значение которого может использоваться как косвенный дескриптор ка- 
талога, обычно являющийся настоящим именем дескриптора каталога. 


соппесї 
соппесї 50СКЕТ, МАМЕ 


таа 


Хх 
0 | 


х 
|| АВС || 


= 


Инициирует соединение с другим процессом. который находится в ожидании 
в вызове ассері. Возвращает истинное значение в случае успеха и ложное в про- 
тивном случае. Аргумент МАМЕ должен быть упакованным сетевым адресом сокета 
надлежащего типа. Приведем пример, предполагающий, что 50СКЕТ является ра- 
нее созданным сокетом: 


изе Зоскет; 


пу (Фгетофе, Фрогі) = (“ммм. рег1. сом”, 80); 
пу $беѕтадаг = зоска@аг_1п(Фроге, іпеї_атоп($"ето+е) ); 
соппесї 50СК, $деѕтайдг 

|| діе "Сап' соппесї їо фгепоѓе аї рогї $рогї: $!"; 


Чтобы отсоединить сокет, используйте с1056е или ѕћиїбомп. См. также примеры 
в разделе «Сокеты» главы 15. См. также соппесі(2). В большинстве случаев для 
сокетов лучше использовать высокоуровневый интерфейс. предоставляемый мо- 
дулем І10::50оскеї. 
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сопіпие 


Это – обычная инструкция управления потоком выполнения, а не функция. Если 
инструкция сопііпие применяется к блоку ВЕОСК (например, в цикле мһі1е или 
Гогеас!), она всегда выполняется непосредственно перед вычислением условного 
выражения, а в циклах їог(;;) она выполняется перед выполнением третьей части 
инструкции. То есть, ее можно использовать для приращения переменной цикла, 
даже когда цикл был продолжен инструкцией пех{ (которая напоминает инст- 
рукцию сопііпие в языке С). 


Внутри блока сопїіпие допускается использовать инструкции 1а5ї, пех{ или гедо; 
1аз1 и гедо в этом случае будут вести себя, как если бы они были выполнены в ос- 
новном блоке. То же верно и для инструкции пехї, но, поскольку она вызовет вы- 
полнение блока сопііпие, может сложиться интересная ситуация. 


мһіЛе (ЕХРВ) { 
нан гедо всегда передает управление сюда 
до_ѕотеїһіпд; 
} сопііпие { 
НЕН пехї всегда передает управление сюда 
до ѕопеїћіпо_е15е; 
# затем переход в начало цикла к проверке ЕХРН 
} 


НЕЕ 1а51 всегда передает управление сюда 


Отсутствие блока сопііпие эквивалентно использованию пустого блока, что доста- 
точно логично, поэтому пех{ передаст управление выражению проверки условия 
в начале цикла. См. раздел «Операторы циклов» в главе 4. 


Однако если включена особенность "зи сп”, сопїіпие также является оператором, 
осуществляющим выход из текущего предложения мһеп или блока дегаи1\, и, по 
умолчанию, передает управление следующему предложению. См. раздел «Инст- 
рукция #1уеп» в главе 4. 


СО5 [| 


соѕ ЕХРЯ 
с03 


Возвращает косинус ЕХРА (выраженный в радианах). Например, следующий сце- 
нарий выведет таблицу косинусов углов, измеренных в градусах: 


# “Ленивый” способ перевода градусов в радианы. 


фрі = афап2(1,1) + 4; 
фрі омег_180 = $рі/180; 


# Вывод таблицы. 
Рог ($069 = 0; $9е9 <= 90; $0е9д++) { 

ргіпі? "За %7.5#\п", $9е9, соз($4е9 * $рі омег 180); 
} 


Операция, обратная взятию косинуса, выполняется посредством функции асоѕ() 
из модуля Маїћ: Тгід или РОЗТХ, или при помощи соотношения: 


зир асоз { аїап2( ѕагі(1 - $ [0] * $ [0]), $ [0] ) } 
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сгурї ЕІ 


сгурЕ РЕАТИТЕХТ. ЅАІТ 


Вычисляет необратимый хэш-код строки точно в стиле сгуриЗ). Это до некоторой 
степени полезно для проверки файла паролей на наличие нестойких паролей, 
хотя на самом деле задача в первую очередь заключается в том, чтобы не допус- 
тить добавления плохих паролей. 


Функция сгурї необратима по замыслу, что можно сравнить с разбиванием яиц 
для приготовления омлета. Не существует (известного) способа расшифровать за- 
шифрованный пароль, кроме исчерпывающего перебора. 


При проверке зашифрованной строки передавайте зашифрованный текст в аргу- 
менте 541Т (например, сгурі($р1аіп, $сгуріей) ед %сгурїеа). Это позволит програм- 
ме работать как со стандартной версией сгурї, так и сболее экзотическими реали- 
зациями. 


Выбирая новое значение 54/7, необходимо, как минимум, создать случайную 
строку из двух символов, принадлежащих множеству [ /0-9А-7а-2] (например, пу- 
чем јоіп “”, (“.”,”/", 0..9, “А".."7", "а".."2")[гапа 64, гапа 64]). В старых реализаци- 
ях сгурї требовались только первые два символа из 5417, но код, дающий только 
два первые символа, считается теперь непереносимым. Интересные подробности 
можно найти на странице руководства для сгурі(3). 


Следующий пример проверяет – знает ли тот, кто работает с этой программой, 
свой пароль: 


Фри = (де%рми19 ($<))[1]; # Предполагается, что мы в УМХ. 


зузтет "ѕїїу -еспо“; # или см. Тегт: :Веаакеу в СРАМ 
рг1пф “Пароль: ”; 

спопр($мог@ = <5ТрІМ); 

ргіпт "\п"; 

зузтет “эту есһо”; 


1? (сгуре($мога, $рмд) пе $рма) { 
діе "Извини. . .\п"; 

} е1ѕе { 
ргіпі “Порядок\п”; 

} 


Разумеется, вводить свой пароль по просьбе всякого, кто об этом попросит, небль- 
горазумно. 


Теневые файлы паролей несколько более безопасны, чем традиционные файлы 
паролей, и для доступа к ним могут потребоваться права суперпользователя. По- 
скольку мало какие программы должны выполняться с такими широкими пол- 
номочиями, можно сделать так, чтобы программа поддерживала собственную не- 
зависимую систему идентификации, сохраняя обработанные сгурї строки в фай- 
лах, отличных от /еѓс/раѕѕюа и /еіс/ѕћрайош. 


Функция сгурї не пригодна для шифрования больших объемов данных хотя бы 
потому, что вы не сможете получить свою информацию обратно. Загляните в ка- 


1 Это разрешается делать только тем, кто имеет достойные намерения. 
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талоги Сгурт::*, 019631: :+ и РбР::* на своем любимом зеркале СРАМ, и вы обнаружи- 
те множество модулей, которые могут оказаться полезными. 


При шифровании строк Юникода, которые могут содержать символы с кодами 
выше 255, Рей попытается скопировать эту строку в строку 8-разрядных байтов 
и только потом вызовет сгурї, передав ей копию. Если этот прием сработает, хоро- 
шо. А если нет, сгурї возбудит исключение. 


абтсіоѕе | ЕН П 
дбтс10ѕе НАСА 


Разрывает связь между файлом ОВМ (базы данных) и хешем. 


Обтс105е в действительности является просто вызовом ип{1е с надлежащими аргу- 
ментами, но оставлена для совместимости со старыми версиями Рег]. 


ЧЬтореп | 
дртореп нАЗН, МВМАМЕ, МОРЕ 


Связывает файл ОВМ с хешем (т.е. ассоциативным массивом). (ОВМ означает «@а- 
фабазе тапахетет%» — управление базой данных - и состоит из набора библиотеч- 
ных подпрограмм на языке С, обеспечивающих произвольный доступ к записям 
с использованием алгоритма хеширования.) НАЗН является именем хеша (вместе 
с %). ОВМАМЕ-— имя базы данных (без каких-либо расширений, таких как . или 
.рид). Если база данных не существует и задан допустимый режим МООЕ, Чбтореп 
создаст файл базы данных с правами доступа, определяемыми аргументом МОЕ 
и значением маски шпаѕЕ. Чтобы предотвратить создание новой базы данных, 
в аргументе МОРЕ можно передать значение ипдет, и функция вернет ложное значе- 
ние, если не сможет найти указанную базу данных. Значения, присвоенные хешу 
до вызова Обтореп, окажутся недоступными. 


Функция йрпореп в действительности просто вызывает їіе с надлежащими аргу- 
ментами и оставлена для совместимости с «древними» версиями Ре]. Функция 
дбтореп возвращает значение, полученное от функции {1е: связанный объект в слу- 
чае успеха и ложное значение в случае неудачи. Управлять выбором используемой 
библиотеки РВМ можно непосредственно с помощью интерфейса {1е, либо путем 
загрузки соответствующего модуля перед вызовом брпореп. Вот пример, который 
работает на некоторых системах с версиями ГЕ _Ғі1е, сходными с версиями в брау- 
зере №еїѕсаре: 


иѕе 0В8_Е11е; 
дбтореп(%№5 Ні51, "ФЕМУ{НОМЕ} /. пеѕсаре/һіѕїогу. да”, ипдеЁ) 
|| діе "Невозможно открыть файл истории пеёѕсаре: $!“ 


мһі1е (($иг1, $һеп) = еасһ №5 Ніѕї) { 
пех ип1еѕѕ деѓіпед($мһћеп); 
спор ($иг1, Ф$мһеп); # удалить замыкающие нулевые байты 
ргіпі? “үіѕітеа %$ аї %3.\п”, Фиг, 
ѕса1аг(1оса1+іте(ипраск(“\". Фићеп))): 


} 


Если у пользователя нет права записи в файл ОВМ, он сможет только читать из хе- 
ша. Выяснить наличие права на запись можно посредством проверки вида -м $і1е, 
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а можно также попытаться выполнить запись в хеш внутри инструкции е\уа1 {}, 
которая перехватит исключение. 


Такие функции, как Кеуз и уа1иез, могут возвращать очень большие списки значе- 
ний при работе с большими файлами ОВМ. Более предпочтительным для обхода 
записей в больших файлах ОВМ может оказаться применение функции еасі, по- 
зволяющей не загружать в память файл целиком. 


Для хешей, связанных с файлами ОВМ, действуют ограничения, накладывае- 
мые используемым пакетом ЭВМ, в том числе ограничение объема размещаемых 
данных. В случае работы с короткими ключами и значениями такие проблемы 
возникают редко. См. также описание модуля ОВ_Е11е. 


Следует также помнить, что многие существующие базы данных ОВМ содержат 
ключи и значения, заканчивающиеся пустым символом, поскольку создавались 
для программ на С. Например, файл журнала М№Меіѕсаре и старый файл псевдони- 
мов ѕепатаійі. В таких случаях следует использовать "$кеу\0" для извлечения зна- 
чения, а затем удалять из него пустой символ: 


Фа1іаѕ = $а1іаѕеѕ{ "роѕітаѕїтег\0" }; 
фа11аз =- 8/\0\2//; # удалить пусгой символ 


Начиная с версии у5.8.4 строки, завершающиеся пустыми символами, можно об- 
рабатывать автоматически, с помощью стандартного модуля 0ВМ_Рі1їег. 


изе 0В _Рі1е; 

$06 = Чопореп(%а11іаѕеѕ, "/еіс/таї1 /а1іаѕеѕ”, ипдеғ) 
|| 91е “невозможно ббтореп /еїс/таі1 /а1іаѕеѕ: $! ` 

ф00->Еі1+ег_Риѕћ( "пи11"); 

$а11аз = фа азез{ роѕїтаѕїег" }; 

ргіпЕ “роѕїтаѕїег является псевдонимом $а]1аз\п”; 


Аналогичную стратегию с успехом можно использовать при добавлении фильтра 
178 в дескриптор файла. Примеры использования строк Юникода в качестве клю- 
чей и значений в файлах ОВМ можно найти в главе 6. 


В настоящее время нет универсального встроенного средстьа блокировки файлов 
ОВМ. Некоторые считают это ошибкой. Модуль 608М Рі16е делает попытку обеспе- 
чить блокировку на уровне файла в целом. Если есть сомнения, лучше использо- 
вать отдельный файл блокировки. 


4еНпеа Га 


дегіпеа ЕХРЯ 
беғіпед 


Возвращает логическое значение, говорящее о том, имеет ЕХРЕ определенное зна- 
чение или нет. По большей части данные, с которыми вы имеете дело, являются 
определенными, но скаляр, который не содержит допустимого строкового, число- 
вого или ссылочного значения, считается содержащим неопределенное значение, 
или, для краткости, ипіеѓ. Инициализация скалярной переменной конкретным 
значением определяет ее, и она остается определенной. пока не получит неопреде- 
ленное значение посредством присваивания или вызова ипдет. 


Многие операции возвращают ипде! в случае исключения, например, когда достиг- 
нут конец файла, использовано значение неопределенной переменной, возникла 
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ошибка операционной системы и т.д. Поскольку ипіеѓ – это разновидность лож- 
ного значения, простая логическая проверка не различает ипдеГ, числовой ноль, 
пустую строку и строку из одного символа (0 – все они являются одинаково лож, 
ными. Функция беѓіпей позволяет отличить неопределенную пустую строку от 
определенной пустой строки, когда применяются операторы, которые действи- 
тельно могут возвращать пустую строку. 


Следующий фрагмент проверяет скалярное значение из хеша: 
ргіпі і? деғіпеа $эмафсн{0}, 


При таком использовании с элементом хеша беѓ1пей только сообщает, является ли 
значение определенным, но не свидетельствует о наличии или отсутствии ключа 
в хеше. Допустимо иметь ключ, значение которого является неопределенным, 
и при этом сам ключ существует. Используйте ехіѕїѕ, чтобы определить, сущест- 
вует ли ключ. 


В следующем примере действует соглащение, в соответствии с которым некото- 
рые операции возвращают неопределенное значение, когда кончаются данные 
(предполагается, что значение ипдет не является допустимым): 


ргіпі "фуа1\п” мһіле деЁ1тед($уа1 = рор(@агу)); 


А в следующем примере мы делаем то же самое с функцией деїрмепї, чтобы из- 
влечь информацию о пользователях системы. 


ѕеїрмепі(); 

мһі1е (деѓіпед($папе = деїрмепі())) { 
ѕау "<<фпате>>"; 

} 

епармепї(); 


Тот же прием можно использовать для проверки успешности системных вызовов, 
которые могут возвращать ложное значение: 


діе “Невозможно геаб1іпк $ѕут: $!" 
ип1еъу деҒіпей($уа1џе = геад1іпк $ѕут), 


С помощью йеѓіпед можно также проверить, определена ли подпрограмма. Этс 
позволит избежать аварии при вызове несуществующих подпрограмм (или под- 
программ, которые объявлены, но не имеют определения): 


1101 г( “Гипспате”, @аг91151); 


зиб іпдіг { 
пу $ѕирпате = эВ"; 
по ѕігісї “ге?ѕ”; # чтобы использовать ѕирпате косвенно 
1 (деғіпеа &$зибпате) { 
&$зибпате(@_), # или $зибпате->(@_); 
} 
е1зе { 


магп “Игнорирую вызов недопустимой функции $зибпате”; 


} 


Однако даже неопределенные подпрограммы могут быть доступны для вызова, 
если в пакете имеется функция АЏТО ОАВ, обслуживающая вызовы неопределен- 
ных функций в этом пакете. 
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Не рекомендуется использовать беѓіпей с объектами составными (хешами и мас- 
сивами), поскольку для них беѓіпед сообщает лишь о выделении памяти под объ- 
ект. Вместо этого лучше просто проверять число элементов массива или хеша: 


1Ғ (@ап_аггау) { ргіпі "массив содержит элементы\и” } 
1Р (Фа вази) { ргіпї “хеш содержит элементы\п” } 


Будучи вызванной для элемента хеша, деГ1пед сообщает, является ли значение 
определенным, но не свидетельствует о наличии или отсутствии ключа в хеше. 
Для проверки наличия ключа используйте ехіѕіѕ. 


См. также ипдЕТ и ехіѕїѕ. 


деве 
деЈете ЕХРА 


Удаляет элемент (или срез элементов) из указанного хеша или массива. (См. ип1іпк, 
если требуется удалить файл.) Удаленные элементы возвращаются в указанном 
порядке, хотя для связанных переменных, например файлов ОВМ, это не гаран- 
тируется. После операции удаления функция ехіѕіѕ возвращает ложное значение 
для любого удаленного ключа или индекса. (Для сравнения: после вызова ипіеѓ 
функция ехіѕіѕ продолжает возвращать истинное значение, поскольку функция 
ипдеѓ лишь присваивает элементу неопределенное значение, но не удаляет его.) 


Удаление из хеша %ЕМУ модифицирует среду выполнения. Удаление из хеша, свя- 
занного с файлом ОВМ (доступным для записи), удаляет запись из этого файла 
ОВМ. 


Удаление из массива ведет к тому, что элемент в указанной позиции возвращает- 
ся в полностью неинициализированное состояние, но образующийся разрыв при 
этом не закрывается, так как это изменило бы позиции последующих элементов. 
Чтобы получить массив без разрывов, используйте функцию $р11се. Однако если 
удалить последний элемент массива, длина массива сократится на единицу или 
более. в зависимости от положения нового последнего элементь&, если он есть. 


Вызывать де1ете для массивов не рекомендуется, и такая возможность, вероятно, 
будет устранена в будущем. 

ЕХРА может иметь произвольную сложность при условии, что последняя операция 
является поиском в хеше или массиве: 


# создать массив массивов из хеша 
$Чипдеоп[$х ][$у] = \Фргорегїіеѕ; 


# удалить одно свойство из хеша 
де1еїе $дипдеоп[$х][$у] {“ОССУРТЕО" } 


# удалить сразу три свойства из хеша 
де1лете @{ $дипдеопт[$х][$у] }{ “ОССУРТЕЦ",  ОАМР”, “ЕТЕНГЕЙ” }; 


# удалить ссылку на Жргорегїіеѕ из массива 
деЈеїе $дипдеоп[$х][$У1; 


В следующем примитивном примере происходит неэффективное удаление всех 
значений из %паз!: 
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Ғог ту $Кеу (Кеуѕ Жһаѕћ) { 
де1ете $пазн{$Кеу}; 
} 


Так же как и в этом: 
де1е+е @разп{Кеу$ Уразп}; 


В обоих случаях результат достигается медленнее, чем в случае присваивания 
пустого списка (если сделать хеш неопределенным, тоже получится быстрее): 


Уназп = (); # полностью очистить Хһћаѕћ 
ипде? %пазй; # забыть, что Жһаѕћ когда-либо существовал 


Аналогично, для массивов: 


Рог ту $іпаех (0 .. $наггау) { 
бе1ете $аггау[ $іпдех]; 
} 


че1ете баггау[0 $ваггау]; 
менее эффективны, чем любая из этих операций: 


@аггау = (); # полностью очистить @аггау 
ипдеЁ @аггау; # забыть, что @аггау когда-либо существовал 


Для локализованного удаления элементов массива или хеша в текущем блоке 
можно также использовать конструкцию е1еїе 10са1 ЕХРА. Локально удаленные 
элементы прекращают свое существование только до выхода из блока. 


3, 


ае $@ 
931е Е15Т 
91е 


Вне еуа1 эта функция выводит значение, составленное из элементов из списка 
115Т, в ЭТОЕВН и завершает программу с текущим значением $! (переменная еггпо 
С-библиотеки). Если $! равна 0, выход производится со значением $? >> 8 (что яв- 
ляется значением кода завершения последнего порожденного процесса, получен- 
ного из эузтет, маії, с1озе для канала или `соппапа`). Если значение $? >> 8 равно 0, 
осуществляется выход со значением 255. 


Внутри еуа1 эта функция записывает в переменную $0 сообщение об ошибке и вы- 
ходит из е\а1, возвращая ипдег. Функция 01е может, таким образом, применяться 
для создания именованных исключений, обрабатываемых на более высоком уров- 
не программы. См. описание функции е\а1 далее в этой главе. 


Если [15Т- единственная ссылка на объект, предполагается, что это объект ис- 
ключения, и он возвращается в исходном виде как исключение в $6 (описывается 
ниже). 


Если список {157 пуст, а $@ уже содержит строковое значение (например, остав- 
шееся от предшествующего вызова е\а]), то это значение повторно используется 
после добавления “\ї...ргорадаїей". Это полезно для распространения (повторного 
возбуждения) исключений: 
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е\ма1 {... }; 
діе ип1езз $@ =- /Ожидаемое исключение/; 


Если список [15Т пуст, а $6 уже содержит объект исключения, вызывается метод 
$@->РВОРАСАТЕ с дополнительными параметрами, именем файла и строкой в файле, 
чтобы определить, как должна распространяться ошибка, и возвращаемое значе- 
ние сохраняется в переменную $6. То есть как если бы была выполнена инструк- 
ция 1! $@ = ема1 { $@->РАОРАСАТЕ(__ РШЕ _, _ "ТМЕ__) }. 


Если |15Т пуст и $@ пуста, используется строка "01іей". Если необработанное ис- 
ключение привело к завершению интерпретатора, код завершения определяется 
из значений $! и $? с помощью следующего псевдокода: 


ехіт $! 1? $1, # еггпо 
ехії $? >> 8 1? $? >> 8; # код завершения дочернего процесса 
вхії 255; # крайний случай 


Цель состоит в том, чтобы уместить как можно больше информации о вероятной 
причине в ограниченное пространство системного кода завершения. Однако, по- 
скольку $! может быть установлена любым системным вызовом, значение кода 
завершения, использованного функцией іе, может оказаться непредсказуемым, 
поэтому не следует заниматься его интерпретацией; лучше ограничиться фактом 
отличия этого значения от нуля. 


Если последнее значение в / 157 не оканчивается символом перевода строки (и вы 
не передаете объект исключения), к сообщению дописываются имя файла теку- 
щего сценария, номер строки и номер вводимой строки (если такая есть), а также 
символ перевода строки. Совет: иногда можно сделать сообщение более осмыслен- 
ным, добавив в него ", ѕіоррей”, если далее в сообщение будет добавлена такая 
строка, как "аї зсг1ртпате Ііпе 123”. Допустим, что выполняется сценарий сапаза; 
посмотрите на разницу между двумя способами использования 01е: 


діе “/изг/датез 18 по уооа”; 
діе “/изг/датез 1$ по 9000, ѕїорред ; 


порождающими, соответственно: 


/иѕг/датеѕ 13 по 90049 аї сапазфа 1іпе 123 
/изг/датез 1$ по 9004, ѕїорред аї сапазфа 11пе 123. 


Чтобы использовать собственные сообщения об ошибках с именами файлов и но- 
мерами строк, используйте специальные лексемы __ ҒПЕ_ _ и __ 11\Е__ (которые не 
интерполируются в строки): 


01е зрг1пЕР 99(”%$” строка "%5", тьфу на тебя!\п), 
_ РНЕ, МЕ“ 


В результате получится такой вывод: 
"сапаѕта", строка 38, тьфу на тебя! 


Е ще одно замечание по поводу стиля: посмотрите на следующие эквивалентные 
примеры: 


01е “Сап `ї са їо ѕроо1: $!“ џп1еѕѕ сйд1г “/изг/зроо1/пем$”; 
сһаіг(" /иѕг/ѕроо1 /пемз” ) || 91е “Сап 'ї са їо $р001: $!” 


Поскольку важной частью является сһііг, вторая форма в целом предпочтительнее. 
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Функцию Піе можно также вызвать со ссылкой, а если заключить этот вызов 
в е\а1, то $6 будет содержать эту ссылку. Этс позволяет вовлекать в обработку ис- 
ключений объекты, способные хранить любую информацию об исключении. Та- 
кая схема иногда предпочтительнее сопоставления строковых значений из $6 с ре- 
гулярными выражениями. Поскольку переменная $0 является глобальной, а еуа1 
может использоваться в реализации объекта, будьте внимательны, чтобы при 
анализе не затереть ссылку на объект ошибки в глобальной переменной. Это лег- 
ко обеспечивается созданием локальной копии перед началом манипуляций. На- 
пример: 


иѕе Ѕса1аг: :0111 "Б1еѕѕей”; 


еуа1 { МНАТЕУЕЯ; діе Ѕопе: : Мойџ1е: : Ехсертіоп->пем( ҒОО => “Баг” ) }; 
11 (ту $еуа1_егг = $6) { 
і? (61е55е9($еуа1_егг) && $еуа1 егг->іѕа(“Ѕопе: : Мойџ1е: :Ехсерїіоп")) { 
# обработать Ѕопе : :Моди1е: : Ехсертіоп 
} 
е1зе { 
# обработать любые другие исключения 


} 


Поскольку перед выводом все неперехваченные исключения превращаются интер: 
претатором в строки, у вас, возможно, появится желание переопределить в объ- 
екте-исключении операцию преобразования в строку. Подробности - в главе 18. 


Можно определить функцию, которая будет вызываться непосредственно перед 
йіе, сохранив такую функцию в $$16{__01Е__}. Данной функции-обработчику бу: 
дет передаваться текст сообщения об ошибке, который может быть изменен обра: 
ботчиком (если необходимо) повторным вызовом 01е. Лишь опытные и отчаянные 
маги предпринимают попытку сотворить такое волшебство, и мало кто из них 
остается в живых. 


См. также описания е\а1, ехії, магп, %516, прагмы магпіпдѕ и модуля Сагр. 


до (Моск) 
бо ВЕОСК 


Форма йо ВЕОСК выполняет последовательность команд в блоке и возвращает зна- 
чение последнего выражения, вычисленного в блоке. Если присутствует модифи- 
катор мһі1е или џипїі1, Рей выполнит ВЁОСКодин раз, прежде чем проверить условие 
цикла. (В других командах модификаторы цикла сначала проверяют условие.) 
Сама конструкция йо ВОСК циклом не считается, поэтому команды управления 
циклом пехї, 1аз{ и гедо нельзя применять для выхода из блока или его перезапус- 
ка. О том, как обойти это ограничение, читайте в разделе «Голые блоки» главы 4. 


до (Ме) [т] 


90 ЕПЕ 


Форма бо ЕЕ использует значение ЕЕ как имя файлаё и выполняет содержимое 
файла как сценарий Рен. Ее основным назначением является (или, скорее, явля- 
лось) включение подпрограмм из библиотеки, поэтому: 
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бо “5Таф.р1”; 
имеет большое сходство с: 
зса]аг ема] `саї ѕїаї.р1`; # `1уре Ѕїаї.р1` в И 90$ 


за исключением того, что йо более эффективна, более выразительна, использует 
имя текущего файла для сообщений об ошибках, выполняет поиск в каталогах, 
перечисленных в массиве @Т\С, и обновляет %1\С, если файл найден. (См. главу 25.) 
Разница еще и в том, что код, выполняемый с помощью 40 ЁГЕ, не видит лексиче- 
ские переменные из охватывающей лексической области ьидимости, тогда как 
код в еуа1 ЕЕ видит их. Они одинаковы в том, что заново производят анализ 
файла при каждом вызове; поэтому нежелательно делать это в цикле, если толь- 
ко само имя файла не меняется при каждом проходе цикла. 


Если оо не может прочесть файл, возвращается иподет, и $! присваивается ошибка. 
Если йо может прочесть файл, но не может его скомпилировать, возвращается 
ипдер, а сообщение об ошибке записывается в $6. Если файл успешно скомпилиро- 
ван, бо возвращает значение последнего вычисленного выражения. 


Включение библиотечных модулей (имеющих обязательный суффикс рт) лучше 
выполнять с помощью операторов изе и гедилге, которые также проверяют ошиб- 
ки и возбуждают исключение при возникновении ошибки. Они обеспечивают 
и другие преимущества: позволяют избежать повторной загрузки, содействуют 
объектно-ориентированному программированию и дают советы компилятору по 
прототипам функций. 


Но бо ЕПЕ все еще может пригодиться, например, для чтения файлов конфигура: 
ции программы. Ручную проверку ошибок можно произвести так: 


# прочитать файлы конфигурации. сначала системные, затем пользовательские 
Рог $Рі1е (“/иѕг/ѕһаге/ргодуіе/деҒаџ1їѕ. гс”, 
"ФЕМУ{ НОМЕ; /. ѕотер"одгс”) 


ип1е$$ ($гефигп = до $ті1е) { 
магп "соџ1йп'ї рагѕе $#11е: $6” 1 $0; 
магп "соџ1дп'ї до $#і1е: $!” ип]езз деҒіпеа Фгефигп: 
магп “сои19п’ тип $#і1е" џп1е55 Фгеїигп; 


} 


Долго работающий демон может периодически проверять временную метку на 
своем файле конфигурации, и, если файл изменился после предыдущей попытки 
чтения, вызывать 00, чтобы перезагрузить этот файл. 00 позволяет реализовать 
это более аккуратно, чем геди1ге или изе. 


до (ѕибгоиїіпе) 


до ЅИВНОШТІМЕ( ТТ) 


до Ѕ/ВВОШТІМЕ(1 Т5Т) – устаревшая форма вызова подпрограммы. Если 5/8АО0ТІМЕ не 
определена, возбуждает исключение. См. главу 7. 
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аитр 


дитр ЕАВЕЕ 
дитр 


Вызывает немедленный вывод дампа памяти. В основном это нужно, чтобы с по- 
мощью программы ипдитр (не поставляется) превратить дамп памяти в испол- 
няемый двоичный файл после инициализации своих переменных в начале про- 
граммы. При запуске такого двоичного файла сначала выполняется 9010 [АВЕ (со 
всеми ограничениями, присущими 0010). Считайте, что дитр [АВЕ — это инструк- 
ция перехода 9010, в ходе которой выполняется дамп памяти и происходит пере- 
воплощение. Если [АВЕ опущена, программа перезапускается с начала. Внима- 
ние: все файлы, открытые в момент создания дампа, не будут открыты при пере- 
воплощении программы, что может запутать Рег. См. также описание ключа 
командной строки -и в главе 17. 


Эта функция сейчас значительно устарела, потому что крайне трудно в общем 
случае преобразовать дамп памяти в исполняемый файл, а также потому, что ее 
заменили различные серверы компиляции для генерации переносимого байт-ко- 
да и компилируемого С-кода. Однако люди, управляющие проектом развития 
компилятора Рег (рейсс сотоварищи) в СРАМ, сообщают, что поддержка отр 
и ип4итр вскоре может воскреснуть. 


Если вы планирует использовать дипр для повышения скорости выполнения про- 
граммы, изучите вопросы эффективности, рассмотренные в главе 21, а также ге- 
нератор кода Ре! в главе 16. Можно также рассмотреть возможность автоматиче- 
ской загрузки и самозагрузки, благодаря которым, по крайней мере, покажется, 
что программа выполняется быстрее. 


Х 
еасһћ Ас 
еасһ НАЗН 
еасћ АВВАУ 
еасћ ЕХРВ 


Обходит элементы хеша, выбирая на каждом шаге одну пару ключ/значение. 
В списочном контексте еасһ возвращает двухэлементный список, состоящий из 
ключа и значения для следующего элемента хеша, что позволяет обойти хеш. 
В скалярном контексте еасһ возвращает просто ключ очередного элемента в хеше. 
Когда хеш полностью прочитан, возвращается пустой список, который при при- 
сваивании создает ложное значение в скалярном контексте, например при про- 
верке условия цикла. После этого следующий вызов еасп начинает обход хеша 
сначала. Вот пример типичного применения, в котором используется предопре- 
деленный хеш %ЕМ\: 


мһі1е (($кеу, $уа1ие) = еасһ ЕМУ) { 
ргіпі “$кеу=Фуа1ие\п” 
} 


Внутри хеша записи расположены в порядке, кажущемся случайным. Функция 
еасһ соблюдает этот порядок, поскольку каждый хеш помнит, какая запись была 
прочитана последней. Фактический порядок этой последовательности может из- 
мениться в будущих версиях Рег], но гарантируется, что это будет тот же поря- 
док, в каком функция Кеуз (или уа10иеѕ) возвращает результаты для того же хеша. 
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Из соображений безопасности этот порядок может изменяться между прогонами 
программы. 


Для каждого хеша существует единственный итератор, совместно используемый 
всеми вызовами функций өасћ, Кеуз и машеѕ в программе; его можно сбросить, 
прочтя все элементы хеша или вычислиє кеуѕ %һаѕћ или уа1иез %һаѕһ. Если во вре- 
мя итераций производится добавление или удаление элементов хеша, его поведе- 
ние становится не вполне определенным: элементы могут пропускаться или по- 
вторяться. 


Начиная с версии у5.12, аргументом еасп может также служить массив. Роль 
ключей в этом случае играют индексы. В отличие от хеша, для массивов пары бу- 
дут возвращаться в порядке возрастания ключей (индексов массива). 


Начиная с версии у5.14, аргументом еасһ может быть ссылка на «неосвященный» 
хеш или массив. Такая ссылка разыменовывается автоматически. Эта особен- 
ность еасһ считается экспериментальной. Конкретный алгоритм ее работы может 
измениться в будущем. 


мһіле (($кеу, $уа1ие) = еасп $һаѕпгеғ) { 


См. также Кеуз, уа1иеѕ и ѕогї. 


ео? авс 
ео? ЕТЕЕНАМОЕЕ 
ео?() 
еоѓ 


Возвращает истинное значение, если следующая попытка чтения из дескриптора 
файла ЕП ЕНАМІЕ вернет конец файла или если дескриптор ҒПЕНА№:Е не открыт. 
ЕТРЕНАМОЕЕ может быть выражением, значение которого определяет действитель- 
ный дескриптор файла, либо ссылкой на некоторый объект типа дескринтора 
файла. Функция ео? без аргументов сообщает, был ли достигнут конец файла при 
выполнении последней операции чтения из файла. Функция еої() с пустыми 
круглыми скобками () проверяет дескриптор АНСУ (который чаще всего встречает- 
ся как пустой дескриптор файла в ›). Поэтому внутри цикла мћі1е (<>) функция 
еоѓ() со скобками обнаружит конец только последнего файла группы. Используй- 
те еої (без скобок) для проверки каждого файла в цикле мћі1е (<>). Например. сле- 
дующий код вставляет черточки перед последней строкой последнего файла: 


ине (<>) { 
1? (ео?()) { 
ѕау "-° х 30; 
} 
рг1 пт; 


} 


Напротив, следующий сценарий сбрасывает нумерацию строк для каждого про- 
читанного файла: 


# сбрасывать нумерацик строк для каждого входного файла 
мһі1е (<>) { 

пехі і? /^\5*#/; # пропустить комментарии 

ргіпї "$. \1$_. 
} сопїіпие { 
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с1оѕе АНСУ 1Е ео, # Не еот()` 
} 


Подобно "$" в программе ѕед, функция ео! может появляться в диапазонах номе- 
ров строк. Следующий фрагмент выведет строки от /раїїегп/ до конца каждого 
входного файла: 


мп] е (<>) { 
ргіпї і? /раееегп/ еоѓ; 
} 


Здесь триггерный оператор (..) выполняет поиск по шаблону в каждой строке. По- 
ка шаблон не найден, оператор возвращает ложное значение. Когда, наконец, по- 
иск даст результат, оператор начинает возвращать истинное значение, вызывая 
печать строк. Когда, наконец, оператор еоѓ вернет истинное значение (в конце ис- 
следуемого файла), оператор триггера сбросится и снова начнет возвращать лож- 
ное значение для следующего файла в @АВСУ. 


Предупреждение: функция еоѓ считывает байт и затем возвращает его во входной 
поток с помощью ипсеіс(8), поэтому в интерактивном контексте от нее нет поль- 
зы. На практике опытные программисты Рег! редко применяют еоѓ, поскольку 
различные операторы ввода и так ведут себя прилично в условиях циклов мћі1е. 
См. пример в описании ѓогеасі в главе 4. 


СХ 
бза раі 
ема1 ВЕОСК 
еуа1 ЕХРА 
ема1 


Ключевое слово еуа! служит двум разным, но близким целям, представленным 
двумя формами синтаксиса: ема] ВОСК и еуа1 ЕХРА. Первая форма перехватывает 
исключения (ошибки) этапа выполнения, которые могли бы оказаться фатальны- 
ми, аналогично блоку «ігу» в С++ и Јауа. Вторая форма компилирует и выполня- 
ет небольшие фрагменты кода «на лету» на этапе выполнения, а также перехва- 
тывает все исключения, как и первая форма. Однако вторая форма выполняется 
значительно медленнее первой, поскольку каждый раз выполняет синтаксиче- 
ский анализ указанной строки. С другой стороны, она является более универ- 
сальной. Какую бы форму вы ни использовали, еуа1 — оптимальный способ любой 
обработки исключений в Рег]. 


Любая форма еуа1 возвращает значение последнего вычисленного выражения — 
в точности, как подпрограммы. Аналогично, чтобы вернуть результат из середи- 
ны е\а1, можно использовать оператор гетигп. Выражение, предоставляющее воз- 
вращаемое значение, вычисляется в пустом, скалярном или списочном контек- 
сте - в зависимости от контекста вызова е\уа1. Дополнительные сведения о том, 
как определить контекст, можно найти в описании мапїаггау. 


Если возникает перехватываемая ошибка (в том числе полученная в результате 
вызова функции (іе), еуа1] возвращает ипде! и помещает сообщение об ошибке 
(или объект) в $6. Если ошибки нет, $6 устанавливается равной пустой строке, что 
обеспечивает надежный способ проверки наличия ошибок. Достаточно простой 
логической проверки: 
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ема1 {.. }, #8 перехват ошибок этапа выполнения 
1? ($9) {... } # обработать ошибку 


Синтаксис формы еуа1 ВЕОСК проверяется на этапе компиляции, чего вполне дос- 
таточно. (Если вы знакомы с медленной формой еуа1 ЕХРА, вас может смутить это 
обстоятельство.) Поскольку код в блоке компилируется в то же время, что и код, 
находящийся за пределами блока, эта форма еуа1 не способна перехватывать 
ошибки синтаксиса. 


Форма е\а1 ЕХРЯ может перехватывать синтаксические ошибки, поскольку ана- 
лизирует код на этапе выполнения. (Если анализ оказывается неудачным, ошиб- 
ка анализа, как обычно, помещается в $6.) В противном случае значение ЕХРА вы 

полняется, как если бы это была маленькая программа на Рей. Код выполняется 
в контексте текущей программы, что означает доступность для него любых лек- 
сических переменных в окружающей области видимости и возможность измене- 
ния любых нелокальных переменных - так же, как для подпрограмм и форма- 
тов. Код в еуа1 интерпретируется как блок, поэтому все переменные с локальной 
областью видимости, созданные внутри этого блока, действуют только до завер- 
шения е\а1. (См. пу и 10са1.) Как и для всякого кода, завершающие точка с запя- 
той в блоке не требуются. 


Вот простой командный интерпретатор Ре. Он предлагает пользователю ввести 
строку с произвольным кодом на Ре, компилирует и выполняет эту строку, 
и выводит ошибки, если они возникли: 


ргіпі "\лВведите какой-нибудь код на Рег1 


мһі1е (<5ТрІМ) { 
е\а1; 
ргіпі Фа; 
ргіп “\пВведите еше код на Рег1: 


} 
Вот программа гепате, осуществлнющая групповое переименование файлов: 


#1 /иѕг/ріп/рег] 
# гепате - изменение имен файлов 
Фор = 5һіғ+; 
Гог (@АНАСУ) { 
$маѕ = $; 
еуа1 $ор; 
91е 1? $; 
# в следующей строке вызывается встроенная функция, 
# а не сценарий с таким же именем 
гепате ($маз,$_) ип1еѕѕ $маз ед $_ 


} 


Эту программу следует использовать так: 


% гепате ‘3/\.ог19$//` к. 0Г19 
$ гепате ‘у/А-2/а-2/ ип1езз /^МаКе/° * 
Х гепате `$_ .= ".Бад”* к. 


Поскольку еуа1 перехватывает ошибки, которые иначе оказались бы фатальны- 
ми, с ее помощью удобно определять, реализованы ли некоторые конкретные воз- 
можности (например, ѓогк или ѕут1іпк). 
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Поскольку форма е\уа1 ВЕОСК подвергается синтаксической проверке на этапе ком- 
пиляции, обо всех синтаксических ошибках сообщается раньше. Поэтому, если 
вашим целям одинаково хорошо соответствуют обе формы, е\уа1 ЕХРР и ема] ВЕОСК, 
предпочтительнее использовать форму ВЕОСК. Например: 


# сделать деление на ноль несмертельным 
еуа1 { $апѕмег = $а / $6; }; магп $0 11 $6; 


й то же, но менее эффективно при многократном выполнении 
еуа] '$апѕмег = $а / $6'; магп $@ 11 $6; 


# синтаксическая ошибка этапа компиляции (не перехвачена) 
еуа1 { Фапзмег = }; # НЕВЕРНО 


# синтаксическая ошибка этапа выполнения 
еуа1 `Фапзмег =’; # устанавливает $@ 


Здесь код в ВЕОСК должен быть допустимым кодом на Рен, чтобы пройти фазу ком- 
пиляции. Код в ЕХРА не интерпретируется до этапа выполнения, поэтому ошибка 
не возникает, пока не придет время выполнить его. 


Блок в е\а1 ВЕОСК не считается циклом, поэтому команды управления циклом 
пехї, 1а$31 или геоо нельзя применять для выхода или перезапуска блока. 


Конструкция еуа1 571116, выполняемая внутри пакета ПВ, не видит окружающую 
лексическую область видимости, зато ей доступна область видимости первого 
фрагмента кода, не имеющего отношения к 0В. Обычно об этом не приходится бес- 
покоиться, только если вы не собираетесь написать свой отладчик для Рег]. 


ехес [91 


ехес РАТНМАМЕ 1 ТЅТ 
ехес [ІТ 


Функция ехес прекращает выполнение текущей программы, выполняет внеш- 
нюю команду и никогда не возвращает управление!!! Используйте ѕуѕїеп, если 
требуется восстановить управление после выхода из команды. Вызов функциг 
ехес завершается неудачей и возвращает ложное значение, только если команда 
не существует и если она выполняется непосредственно, а не через интерпретатор 
команд системы (читайте далее). 


Если функция получает единственный скалярный аргумент, выполняется поиск 
в этом аргументе метасимволов интерпретатора команд, и в случае успеха аргу- 
мент целиком передается стандартному интерпретатору команд системы (/Біп/ѕ№ 
в ОМІХ). Если метасимволы не найдены, аргумент расщепляется на слова и вы- 
полняется непосредственно, поскольку это позволяет повысить эффективность за 
счет устранения накладных расходов на обработку интерпретатором команд. Это 
также дает большие возможности управления восстановлением после ошибки, 
если программа не существует. 


Если в 1157 больше одного аргумента или / 157 представляет собой массив, Е кото- 
ром более одного значения, системный интерпретатор команд не используется, 
что также исключает какую-либо обработку команды интерпретатором команд. 
Наличие или отсутствие метасимволов в аргументах не оказывает влияния на этот 
режим, что делает форму вызова со списком предпочтительной в программах, где 
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желательно предотвратить атаки через инъекции езсаре-последовательностей 
интерпретатора команд. 


Следующий пример заставляет выполняемую в данный момент программу Рег] 
заменить себя программой есћо, которая выводит текущий список аргументов: 


ехес “еспо“, “Ваши аргументы “, @АНбУ; 


Этот пример показывает, что через ехес можно запустить не только отдельную 
программу, но и целый конвейер. 


ехес “зогт $оит#11е | ипаа” 
|| 91е “Невозможно выполнить ѕогї/ипід: $!” 


Обычно возврат из хес не происходит, а если происходит, то возвращается лож- 
ное значение, и следует проверить $!, чтобы узнать причину. Учтите, что в преж- 
них версиях Регі функции ехес (и ѕуѕїеп) не очищали выходной буфер, поэтому 
требовалось включать буферизацию установкой $| для одного или более дескрип- 
торов файлов, чтобы избежать потери выводимых данных при вызове ехес или их 
смешивания при вызове зузтет. 


Посылая операционной системе запрос на выполнение новой программы в суще- 
ствующем процессе (как это делает функция ехес), вы сообщаете системе местона- 
хождение программы, которую необходимо выполнить, а также сообщаете новой 
программе (через первый аргумент) имя, под которым она вызвана. Обычно сооб- 
щаемое имя является просто копией адреса программы, но это не обязательно, 
так как существуют два различных аргумента на уровне языка С. Если это не ко- 
пия, получается необычный результат: запущенная программа думает, что она 
выполняется под определенным именем, которое может отличаться от того пути, 
где фактически находится программа. Часто это не имеет значения для програм: 
мы, но иногда программы обращают на это внимание и «надевают» разную личи- 
ну, в зависимости от своего текущего имени. Например, редактор оі проверяет, 
вызвали его как “уі" или как \1ем“. Будучи назван “уіем", он автоматически 
включает режим «только для чтения», как если бы был вызван с параметром ко- 
мандной строки -К. 


Здесь вступает в игру РАТНМАМЕ — необязательный параметр ехес. Синтаксически он 
занимает позицию косвенного объекта, как дескриптор файла для ргіпї или ргіпїї. 
Запятая после него недопустима, поскольку этот параметр – не совсем часть спи- 
ска аргументов. (В некотором смысле Рег выбирает подход, противоположный 
установленному операционной системой, предполагая, что важным является пер- 
вый аргумент, и позволяя изменять имя пути, если оно отличается.) Например: 


федіїог = "/иѕг/ріп/мі”; 
ехес Федлтог “у1ем”, @Ғ11еѕ # включаем режим “только чтение” 
|| діе “Невозможно выполнить $едіїог: $! "; 


Как и для любого другого косвенного объекта, простой скаляр с именем програм- 
мы можно заменить блоком с произвольным кодом, что упрощает предыдуший 
пример: 


ехес { "/иѕг/Юріп/мі” } "у1ем” @Г11еѕ # включаем режим “только чтение” 
|| 01е "Невозможно выполнить /иѕг/біп/у1: $! “; 


Мы уже говорили, что ехес рассматривает разрозненный список аргументов как 
указание обойтись без обработки интерпретатором команд. Однако в одном случае 
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можно все же споткнуться. Вызов ехес (и ѕуѕїеп тоже) не различает единственный 
скалярный аргумент и массив, состоящий из единственного элемента. 


@аго$ = (“еспо ѕигргіѕе”); # всего один элемент в списке 
ехес @агд$ # будут обрабатываться езсаре-последовательчосги 
|| діе "ехес: $!” # интерпретатора команд, потому что @агд$ == 


Чтобы избежать этого, можно использовать синтаксис РАТНМАМЕ, явно дублируя 
первый элемент в качестве имени пути, благодаря чему остальные аргументы бу- 
дут интерпретироваться как список, даже если аргумент всего один: 


ехес { $агоѕ[0] } @агдѕ # безопасно даже со списком из одного аргумента 
|| 91е "сап'ї ехес @агаз: $'", 


Первая версия, без фигурных скобок, запустит программу есћо со строкой "зигрг1- 
зе” в качестве аргумента. Вторая версия поступит иначе: она попытается запус- 
тить программу, буквально названную есћо зигргіѕе, не найдет ее (хочется верить) 
и установит признак ошибки в переменной $!. 


Поскольку функция ехес чаще всего используется сразу после ѓогк, предполагает- 
ся, что все, обычно происходящее при завершении процесса Регі, должно быть 
пропущено. После вызова ехес Регі не станет вызывать блоки ЕМ№ или какие-либо 
методы ПЕ$ТАОҮ, связанные с какими бы то ни было объектами. Напротив, порож- 
денный процесс, в итоге, будет вынужден провести ту уборку, которую предполо- 
жительно должен был бы сделать родительский процесс. (Неплохо бы так в ре- 
альной жизни.) 


Поскольку очень часто ехес ошибочно используют вместо зузтет, Ре! выводит 
предупреждение, если следующая команда отлична от (01е, магп или ехії и вклю- 
чен вывод предупреждений. Если действительно необходимо поместить после 
ехес какую-то другую команду, избежать вывода предупреждения можно любым 
из следующих способов: 


ехес (“Род”) || ргапе ЗТОЕАВ “невозможно ехес Ѓоо: $! 
{ ехес (“Роо’) }; ргіпі ЅТ”ЕВА “невозможно ехес Ѓоо: $!"; 


Как показывает вторая строчка, вызов ехес в качестве последней команды блока 
избавляет нас от этого предупреждения. 


Перед выполнением ехес Рей пытается вытолкнуть буферы всех файлов, откры- 
тых для вывода, но на некоторых платформах это может быть невозможно. Для 
большей безопасности, чтобы избежать потери выводимых данных, можно уста- 
новить $| (ФА0ТОҒШОЅН в модуле Еп01151) или вызвать метод аито из! из модуля 
І0::Напд]е для всех открытых дескрипторов файлов. 


Обратите внимание, что ехес не выполняет блоки Е№ и не вызывает методы ОЕЗТНОУ 
ваших объектов. 


См. также ѕуѕіеп. 


ехіѕ5 
ехіѕіѕ ЕХРЯ 


Возвращает истинное значение, если указанный ключ хеша существует в хеше, 
даже если его значение не определено. 
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рг1пЕ “Тгие\п” УР фһаѕһ{ $Кеу ; 
ргіпё "Ехіѕёѕ\п” 1? ех1515 $һаѕһ{$кеу}; 
ргіпі "Ре?іпед\п” і? Пеғіпед $пазп{$кеу}; 


Исторически сложилось так, что функцию ехіѕїіѕ можно вызывать и для элемен- 
тов массива, но в этом случае ее поведение не так очевидно и сильно зависит от 
особенностей работы функции де1е{е с массивами. Однако в настоящее время не 
рекомендуется применять ехіѕїіѕ к массивам, и данная возможность, вероятно, 
исчезнет в будущих версиях Регі. 


ргіпі "Тгие\п” 1? $аггау[$іпаех]; 
ргіпі "Ехіѕіѕ\п” 1+ ехіѕїѕ $аггау[$1поех]: 
ргіпЕ “Оеѓіпед\п" і? деғіпед Фаггау[$1пдех], 


Элемент может быть истинным, только если определен, и может быть определен, 
только если существует. но обратное утверждение не всегда верно. 


Выражение ЁХРЯ может иметь произвольную сложность — при условии, что по- 
следней операцией выражения будет поиск ключа в хеше или взятие из массива 
по адресу: 


1Ғ (ехіѕїіѕ $һаѕһА} {В} {$Кеу}} { } 


Хотя последний элемент не начинает существовать только потому, что было про- 
верено его существование, к промежуточным элементам это относится. Поэтому 
элементы $%$һаѕћ {А} и Фһаѕһ{"А"}->{"В"} появятся сами по себе. Это не функция 
ех1515 как таковая; это происходит везде, где используется оператор стрелки (яв- 
но или косвенно): 


ипде? $геғ; 
іҒ (ехіѕїѕ $геѓ->{"Ѕоте Кеу”}) { } 
ргіпі $гег; # выведет НАЅН(0х800305с) 


Здесь элемент “Зоте кеу” не возник из ниоткуда, но ранее неопределенная пере- 
менная $геї начинает вдруг содержать анонимный хеш. Это удивительный при- 
мер самооживления там, где на первый (и даже на второй) взгляд нет контекста 
левой части присваивания. Такое поведение, вероятно, будет исправлено в буду- 
щих версиях. Чтобы обойти это, можно использовать вложенные вызовы: 


ғ ( фгеғ && 
ехіѕїѕ $геғ->[$х | && 
ехієїѕ $ге#->[$х1[$у] && 


ехіѕїѕ $ге!->[$х][$у]{$Кеу} && 
ехіѕїѕ $геғ->[$х][%у1{%кеу}:2] ) { } 


Если ЕХРВ является именем подпрограммы, функция ехіѕїѕ возвращает истинное 
значение, если эта подпрограмма объявлена — даже если она еще не определена. 
Следующий код выводит только “Ех1515": 


ѕиб #1450; 
ргіпі Ехаѕіѕ\п” 1іЁ ех1515 &Ғ10и0; 
ргіпт "Рреғіпед\п” і? деғіпед &#100; 


Вызов ехіѕїѕ с именем подпрограммы может пригодиться в подпрограмме А0ТОІОАО, 
если потребуется узнать, нужно ли определить некоторую подпрограмму в дан- 
ном пакете. Пакет может указать на это, объявив подпрограмму-заглушку при 
помощи $16, как это было сделано для 115 в примере выше. 
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Имейте в виду, что использование значения, возвращаемого вызовом подпро- 
граммы, вместо имени подпрограммы, вызовет ошибку в ех15+15. 


ехіѕїѕ &5и0; в ОК 
ехіѕіѕ 8500(); # Ошибка круглые скобки означают вызов функции 


ехіё 


ехії ЕХРА 
ехії 


Вычисляет ЕХРА как целое число и немедленно завершает программу с этим значе- 
нием в качестве кода ошибки. Если выражение ЕХРА опущено, функция заверша- 
ет программу с кодом 0 (означающим отсутствие ошибки). Вот фрагмент, позво- 
ляющий пользователю выйти из программы, введя х или Х: 


фапѕ = <ТрІМ; 
ехії іғ $апѕ =- /7[Хх]/, 


Не следует применять ех1т для прерывания выполнения подпрограммы, если су- 
ществует вероятность, что кто-нибудь захочет перехватывать возникшие ошиб- 
ки. Вызывайте вмес:о нее діе, которую можно перехватывать с помощью еха]. 
Либо используйте обертки для (іе из модуля Сагр, например сгоак или сопѓеѕѕ. 


Мы сказали, что функция ехії осуществляет немедленный выход, но это была на- 
глая ложь. Она выходит, как только это станет возможным, но сначала вызовет 
все имеющиеся подпрограммы ЕМ№ для выполнения заключительных операций. 
Эти подпрограммы не могут прервать выход, но могут изменить итоговое значе- 
ние кода завершения, установив значение переменной $?. Аналогично любой 
класс, в котором определен метод ОЕЗТНО\, вызовет его для всех своих объектов, 
прежде чем произойдет окончательный выход из программы. Если действитель- 
но требуется обойти обработку при выходе, можно вызвать функцию _ехії иг мо- 
дуля РО$1Х; это позволит избежать обработки всех Е№ и деструкторов. А если РОЗ1Х 
отсутствует, можно вызвать ехес "/біп/Ға1ѕе" или сделать что-либо аналогичное. 


ехр [5] 


ехр ЕХРЯ 
ехр 


Возвращает е (основание натурального логарифма) в степени ЕХРА. Чтобы полу- 
чить значение е, выполните ехр(1). Для возведения в степень по любому основа- 
нию используйте оператор **, украденный нами из ГОНГНАМ: 


ие Маїћ: : Сотр1ех, 
ргіпё -ехр(1) *^ (1 * рі); # выведет 1 


__ЕПЕ__ 


Специальная лексема, возвращающая имя файла, в котором произошло обраще- 
ние к ней. См. раздел «Генерирование Регі в других языках» в главе 21. 
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к еп 


Ғс ЕХРА 
с 


Эта функция, впервые появившаяся в Рег! версии у5.16 и доступная в области 
действия прагмы џѕе Ғеаїџге “їс”, возвращает полную свертку регистра символов 
Юникода в ЕХРА. Это — внутренняя функция, реализующая действие езсаре-после- 
довательности \Ғ для свертки регистра в строках. Как заглавный регистр основан 
на верхнем регистре, но несколько отличается, так и свернутый регистр основан 
на нижнем регистре, но отличается. В наборе символов АЗСИ имеется всего два 
регистра символов, однозначно соответствующих один другому, но в Юникоде ис- 
пользуется отношение «один-ко-многим», и уже между тремя регистрами. Из-за 
того, что каждый раз возникает слишком много комбинаций, требующих про- 
верки вручную, был введен четвертый регистр, свернутый (ѓоЇсаѕе), используе- 
мый как промежуточный для всех трех. Это не регистр символов в полном смыс- 
ле слова, но он распознается. 


Чтобы сравнить две строки без учета регистра символов. выполните следующее: 
#с($а) ед #с($0) 


До версии у5.16 единственным надежным способом сравнения строк без учета ре- 
гистра символов был модификатор шаблонов /1, потому что механизм поиска по 
шаблону в Рег! всегда использовал семантику свертки регистра при поиске соот- 
ветствий без учета регистра. Зная это, можно имитировать операцию определе- 
ния равенства, как показано ниже: 


зиб Рс_е9($$) { 

пу($а, $6) =@; 

геёигп Фа =- /ЛА\ОФЬ\Е\ 2/1; 
} 


В более ранних версиях, предшествующих у5.16, функцию їс можно найти в мо- 
дуле Ип1соде: :СазеРо19 из СРАМ. Для сравнения без учета регистра и акцентов мож- 
но использовать методы ед и стр объекта (п1соде: :Со11аїе, которому в конструкторе 
было передано значение 1е\уе1=>1. Или с помощью объекта Ип1соде: :Со11аїѓе: :Іоса]е, 
сконструированного аналогичным образом и предназначенного для сопоставле- 
ния строк с учетом особенностей национальных алфавитов. См. разделы «Оши- 
бочные представления о регистре» и «Сравнение и сортировка строк Юникода» 
в главе 6. 


хукуке 
спі ЕТЕНЕ 
Ғспі1 ЕТЬЕНАМОЕЕ, ЕОМСТТОМ. САГАН 


Вызывает функции управления файлами операционной системы, документи- 
рованные на странице руководства ўѓспі(2). Перед вызовом ѓспї1 необходимо ис- 
пользовать директиву: 


иѕе Еспї1; 


чтобы загрузить определения констант. 
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Аргумент 5САГАЯ может служить как входным, так и выходным значением (или 
и тем, и другим) в зависимости от РИМСТТОМ. Указатель на строковое значение УСАЕАВ 
будет передан в фактический вызов јспі в третьем аргументе. (Если СА АВ не име- 
ет строкового значения, но имеет числовое значение, будет передано непосредст- 
венно это значение, а не указатель на строковое значение.) Наиболее употреби- 
тельные допустимые значения для Ғ/МСТІОМ вы найдете в описании модуля спі]. 


В системах, не поддерживающих ўспі(2), вызов функции їстх1 вызовет исключе- 
ние. В системах, где такая поддержка имеется, можно, например, модифициро- 
вать флаги закрытия при ехес (если нежелательно использовать переменную $`Е 
($5ҮЅТЕМ ЕО МАХ) и флаги неблокирующего ввода/вывода, эмулировать функцию 
ІосЕ{(З) и организовывать прием сигнала 51610 при появлении событий ввода/вы- 
вода, ожидающих обработки. 


Следующий пример демонстрирует перевод дескриптора файла с именем ВЕМОТЕ 
в неблокирующий режим на системном уровне. В результате любая операция вво- 
да немедленно возвращает управление, если нет ничего, что можно было бы про- 
читать из канала, сокета или последовательной линии, которая иначе была бы за- 
блокирована. Кроме того, в этом режиме операции вывода не блокируются, а воз- 
вращают признак неудачи. (В этом случае вам, вероятно, придется также уладить 
дело с $|.) 


изе Еспі1 ом(Е_СЕТРЕЁЕ Е_ЗЕТЕС О _МОМВІОСК); 


$71а9$ = Тспі1 (АЕМОТЕ, Е _СЕТЕЬ, 0) 
|| діе "Невозможно получить флаги для сокета: $!" 
$Ғ1адѕ = Рсп\1(НЕМОТЕ, Р_ЗЕТЕЬ, $#1адѕ | 0_МОМВЕОСК) 


|| 01е "Невозможно установить флаги для сокета: $! “; 


Значения, возвращаемые Гсп{1 (и іост1), перечислены в табл. 27.1. 
Таблица 27.1. Значения, возвращаемые функцией [спН 


Значения, возвращаемые системным вызовом Значения, возвращаемые Рей 


опаде? 


строка "0 биї {гие” 


все прочее это же число 

Таким образом, Ре! возвращает истинное значение при успехе и ложное при не- 
удаче, хотя сохраняется возможность определить фактическое значение, возвра- 
щенное операционной системой: 


$геїуа1 = Ғспї1(...) || -1; 
ргрпЕР "ЁспіЈ фактически вернула %9\п” $геїуа1; 


Здесь даже строка "0 рит 1гие” выводится как 0 благодаря формату %4. Эта строка 
истинна в логическом контексте и принимает значение 0 в числовом контексте. 
Допустимо также использовать простую проверку || 91е возвращаемого значения 
вместо «перекошенной» версии // йіе. (Она также благополучно избавляет от обыч- 
ных предупреждений о недопустимом числовом преобразовании.) 
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епо ХА 
Ғілепо ЕШЕНАМОЕЕ 


Возвращает указатель файла в основе дескриптора файла. Если дескриптор не 
был открыт, ѓі1епо возвращает ипдег. Если дескриптор файла не связан с действи- 
тельным указателем файла операционной системы (что характерно для дескрип- 
торов файлов, связанных с объектами памяти, открытыми вызовом ореп со ссыл- 
кой в третьем аргументе), возвращается -1. 


Указатель файла – это маленькое неотрицательное целое число, например 0 
или 1. Сравните с дескрипторами файлов – например, ЭТОТ и 57001, которые пред- 
ставляют собой символы. К несчастью, операционной системе ничего не известно 
о ваших замечательных символах. Она представляет открытые файлы только 
как эти маленькие номера файлов, и хотя Рег обычно автоматически выполняет 
трансляцию, иногда требуется знать фактический указатель файла. 


Функция ѓііепо может пригодиться, например, при создании битовых массивов 
для $е1есі и для передачи некоторым системным вызовам посредством зузсай(2). 
С ее помощью также можно дополнительно проверить, вернула ли функция ореп 
нужный указатель файла, и определить, не используется ли один и тот же сис- 
темный указатель файла двумя дескрипторами. 


і? (?і1епо(ТНІЅ) == Е11епо(ТНАТ)) { 
ѕау “ТНІЅ и ТНАТ являются дубликатами"; 
} 


Если ЁПЕНАМІЕ является выражением, его значение принимается в качестве кос- 
венного дескриптора файла, обычно его имени или чего-то похожего на объект 
дескриптора файла. 

Не полагайтесь на сохранение связи между дескриптором файла Регі и числовым 
указателем файла на протяжении всего времени работы программы. Если файл 
закрывается и открывается заново, указатель может измениться. Рег! берет на се- 
бя некоторый труд, стараясь, чтобы некоторые указатели не потерялись, если вы- 
зов ореп для них окажется неудачным, но делает это только для указателей фай- 
лов, не выше текущего значения специальной переменной $ ($5ҮЅТЕМ_ҒО_МАХ), по 
умолчанию равного 2. Хотя дескрипторам файлов 5Т01М№, 5ТрОЦТ и ЭТОЕВВ исходно 
сопоставлены указатели файлов 0, 1 и 2 (стандартное соглашение ОМІХ), даже 
они могут измениться, если начать закрывать и открывать их достаточно энергич- 
но. Неприятностей с 0, 1 и 2 быть не может, если открывать их заново сразу после 
закрытия. Основное правило в ОМІХ - выбирать наименьший свободный указа- 
тель, а это именно тот, который был только что закрыт. 


Га |а ХІ 
Яоск $! АВС ИИ 
"Лоск ЕТЕЕНАМОЕЕ, ОРЕНАТТОМ 


Является переносимым интерфейсом блокировки файлов. Блокирует только це- 
лые файлы, а не отдельные записи. Эта функция управляет блокировкой файла, 
связанного с ЁГ ЕНАМІЕ, возвращая истинное значение в случае успеха и ложное 
в противном случае. Чтобы исключить возможность потери данных, Рег очища- 
ет буфер ЕП ЕНАМОЕЕ перед блокированием или разблокированием. Функцию #10ск 
можно реализовать посредством /0ск(2), {[спИ(2), іосЕҢЗ) или другого специфи- 
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ческого для платформы механизма блокировки, но если ни один из них не досту- 
пен, вызов Г1оск возбуждает исключение. См. раздел «Блокировка файлов» гла- 
вы 15. 


Аргумент ОРЕРАТТОМ может принимать значения | ОСК_5Н, 1 ОСК_ЕХ или 10СК_ №, кото- 
рые можно объединять через ИЛИ с 10СК АВ. Эти константы традиционно имеют 
значения 1, 2, 8 и 4, но можно обращаться к ним по символическим именам, если 
импортировать их из модуля Есп1 по отдельности или целиком, используя тег 
ЭАоск. 


10СК_$Н запрашивает блокировку с совместным доступом, поэтому обычно она 
применяется для чтения. 1 0СК_ЕХ запрашивает монопольную блокировку, поэтому 
обычно используется для записи. і 0СК_ ОМ освобождает ранее запрошенную блоки- 
ровку; закрытие файла тоже снимает все блокировки. Если совместно с 10СК_$Н 
или 10СК_ЕХ используется бит [0СК_МВ, вызов Ѓѓ10ск возвращает управление немед- 
ленно, не ожидая, пока недоступная блокировка освободится. Проверяйте воз- 
вращаемое значение, чтобы определить, получена ли запрошенная блокировка. 
Будучи вызванной без флага 1ОСК_МВ, Е1оск может заблокировать выполнение про- 
граммы навечно, ожидая освобождения блокировки. 


Еще одна неочевидная, но традиционная особенность Ѓѓ10ск заключается в реко- 
мендательном характере ее блокировок. Такие блокировки обладают большей 
гибкостью, но дают меньше гарантий, чем жесткие блокировки. Это значит, что 
файлы, заблокированные вызовом !1оск, могут быть модифицированы програм- 
мами, не использующими ѓ10ск. Машины, останавливающиеся на красный свет, 
хоронто уживаются друг с другом, но не с машинами, которые не останавливают- 
ся на красный свет. Будьте внимательны за рулем. 


Некоторые реализации Ё10сКк не могут блокировать файлы в сетевой среде. Хотя 
теоретически можно применять с этой целью более специфическую для системы 
функцию їспї1, но присяжные (удалившись на совещание по этому делу лет де- 
сять назад) все еще не решили, надежно ли это (и даже может ли это быть надеж- 
ным в принципе). 


Следующая программа добавляет корреспонденцию в почтовый ящик в системах 
ОМІХ, используя ДосЁ(2) для блокировки почтовых ящиков: 


иѕе Еспі1 ом/:Е1оск/; # импорт констант І0СК_« 
ѕир му1оск { 
Т1оскК(МВОХ, 10СК_ЕХ) 
|| 91е "невозможно блокировать таі10ох: $!”, 
# на случай, если кто-то что-тс дописал, пока мы ждали, 
# и наш буфер 3910 рассинхронизировался 
ѕеек(МВох, 0, 2) 
|| 91е "невозможно зеек в конец та1100х: $! "; 


ореп(МВОХ, ">> /изг/зроо1 /та11 /ФЕМУ{ИЅЕВ}") 
|| діе “невозможно открыть таі10ох: $!"; 


пу1оск(); 
ау МВОХ $т$9, “\п”; 
с1оѕе МВОХ 
|| діе “невозможно закрыть таі10рох. $! “; 
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В системах, поддерживающих системный вызов [10сЁ(2), блокировки наследуют- 
ся процессами-потомками, порожденными вызовом Тогк. Другим реализациям 
не так повезло. и при ветвлении они, скорее всего, теряют блокировки. См. также 
в разделе «Блокировка файлов» главы 15 другие примеры использования 1 ]оск. 


фогк $ ЕІ 


ТогК 


Делает из одного процесса два посредством системного вызова ѓогА(2). В случае 
успеха возвращает Ш) нового порожденного процесса в родительский процесс и 0 
в порожденный процесс. Если у системы недостаточно ресурсов для размещения 
нового процесса, вызов оказывается неудачным, и возвращается ипоеѓ. Указатели 
файлов (иногда даже с блокировками) используются совместно, а все остальное 
копируется (или, по крайней мере, такое создается впечатление). 


В старых версиях Рег неочищенные буферы остаются неочищенными в обоих 
процессах, что означает необходимость установить $| для одногс или более фай- 
ловых дескрипторов ранее в программе, чтобы избежать дублирования вывода. 


Почти безопасный способ породить процесс, обращая внимание на возможные 
ошибки ветвления, может выглядеть так: 


иѕе Еггпо чм(ЕАСАТМ), 
РОВК: { 
14 ($ріа = Ғогк) { 
# родительский процесс 
# рій порожденного процесса в $р1а 
} 
е151ғ? (деғіпеа $рід) { # $ріс равен нулю. если определен 
# порожденный процесс 
# рід родительского процесса доступен через деїрріа 
} 
е151? ($! == ЕАбАТМ) { 
# ЕАСАІМ является предположительно нефатальной ошибкой ветвления 
$1еер 5; 
гейо РОНК; 
} 
е1зе { 
# фатальная ошибка ветвления 
іе "Ветвление процессов невозможно $! "° 


} 


Такие предосторожности не обязательны для операций, которые неявно вызыва- 
ют [югЁ(2), например, ѕуѕіеп, обратные апострофы или открытие процесса как де- 
скриптора файла, потому что Рец, вызывая ѓогк за вас, автоматически повторяет 
попытки породить процесс, не обращая внимания на временные затруднения. Не 
забывайте заканчивать работу в порожденном процессе вызовом ехії, иначе пото- 
мок выйдет из блока условной инструкции и начнет выполнять код, предназна- 
ченный только для родительского процесса. 


Вызывая Гогк и не дожидаясь завершения порожденных процессов, вы накопите 
«зомби» (процессы, завершившиеся против ожидания родителей). В некоторых 
системах этого можно избежать, установив $516{СНІр) в "ТСМОВЕ"; в большинстве слу- 
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чаев нужно вызыватьма { для умирающих дочерних процессов. Примеры см. в опи- 
сании функции маії, а подробности о ЭТОСНИ - в разделе «Сигналы» главы 15. 


Если ответвившийся процесс наследует дескрипторы системных файлов, такие 
как ЭТОТ и 570007, соединенные с удаленным каналом или сокетом, удаленный 
сервер (например, сценарий ССІ или фоновое задание, запущенное в удаленном 
интерпретаторе команд) окажется зависшим, даже если завершится родитель- 
ский процесс. Повторное соединение системных дескрипторов с другими выходе- 
ми исправит положение. 


В большинстве систем, поддерживающих ѓогА(2), эта функция имеет высокоэф- 
фективную реализацию (например, использование технологии копирования при 
записи (сору-оп-утіїе) для страниц данных), что обусловило доминирование этой 
парадигмы многозадачности в последние десятилетия. Трудно рассчитывать, что 
функция Гогк реализована эффективно (если реализована вообще) в не- ОМХ сис- 
темах. Например, Рег эмулирует правильную ѓогк даже в системах М1сгозой, но 
в этом случае ничего нельзя утверждать относительно производительности. Воз- 
можно, большая удача ждет вас в случае применения модуля 1 п32::Ргосез$. 


Перед созданием дочернего процесса Ре] пытается вытолкнуть буферы файлов, 
открытых для вывода, но на некоторых платформах это может быть невозможно. 
Чтобы избежать двукратного вывода одних и тех же данных, можно установить $ 
(ФАЦТОРЦШЗН в модуле Еп01131) или вызвать метод аибо из! из модуля 10::Напд1е для 
открытых дескрипторов файлов. 


#огтаї 


Ғогтаі МАМЕ = 
расфиге 1іпе 
уа10е 1151 


Объявляет именованную последовательность строк шаблона (рісіиџге іпеѕ) и свя- 
занных величин для функции мгіїе. Если аргумент МАМЕ опущен, по умолчанию 
выбирается имя ЭТООЦТ, которое также является именем формата по умолчанию 
для дескриптора файла 570007. Поскольку это глобальное для пакета объявление, 
обрабатываемое на этапе компиляции, все переменные в списке значений долж- 
ны быть видимы в точке объявления формата, т.е. лексические переменные долж- 
ны быть объявлены выше в файле, а переменные с динамической областью види- 
мости должны быть установлены во время вызова мгіїе. Например (предполагает- 
ся, что значения $с051 и $9џапііїу уже вычислены): 


ту $5 г = "міддеї"; # Переменная с лексической областью видимости 
Ғогта+ №ісе Оџіриї = 
Теѕі: @<<<<<<<< @]| ||| @>>>> 
ф5їг, $%. "$7 и (Фпим) 
1оса1 $- = "№се Оитрит”; # Выбираем наш формат 


1оса1 фпит = $соѕі »* $дџапііїу; # Переменная с динамической областью видимости 
мгіте; 


Подобно файловым дескрипторам, имена форматов являются идентификатора- 
ми, существующими в таблице символов (в пакете), и могут квалифицироваться 
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именем пакета. Внутри таблицы символов форматы располагаются в собствен- 
ном пространстве имен, отдельно от дескрипторов файлов, дескрипторов катало- 
гов, скаляров, массивов, хешей и подпрограмм. Однако, как и эти шесть типов, 
формат с именем Ићһаїеуег подвержен воздействию директивы 1оса1, при примене- 
нии ее к *«\Матеуег. Иными словами, формат — это еще одна штуковина, независи- 
мая от других штуковин и содержащаяся в переменной фуре2]оЪ. 


Раздел «Форматы шаблонов» главы 26 содержит многочисленные детали и при- 
меры применения форматов. Глава 25 описывает внутренние специфические для 
форматов переменные, а модули Еп01131 и 10::Напд1е предоставляют более легкий 
доступ к ним. 


ТоптИпе 
Ғогт]1пе РТСТИВЕ, ЕТ$Т 


Внутренняя функция, которую вызывает Гогта{, хотя можно вызвать ее и са- 
мостоятельно. Всегда возвращает истинное значение. ѓогп!іпе форматирует спи- 
сок значений согласно содержимому шаблона РТСТИРЕ, помещая вывод в накопи- 
тель форматированного вывода, $^А (или ФАССИМИГАТОВ, если используется модуль 
Епд11іѕһ). В конечном счете, вызов мгіїе выводит содержимое $^А в какой-нибудь 
дескриптор файла, но можно прочесть $^А самостоятельно, а затем записать в $`А 
пустую строку ^". Обычно Ѓогп1іпе вызывается для каждой строки формата, но 
сама функция ѓогт1іпе не смотрит, сколько символов перевода строки имеется 
в РІСТИВЕ. Это значит, что маркеры - и -- будут интерпретировать РТСТИВЕ как одну 
строку. Поэтому может потребоваться несколько вызовов ѓогп1іпе для реализа- 
ции формата одной записи, как это и делает компилятор формата. 

Будьте осторожны, если заключаете шаблон в двойные кавычки, поскольку сим- 


вол © может быть принят за начало имени массива. Примеры использования 
см. в разделе «Форматы шаблонов» главы 26. 


—- 
дес [т ВБ 
детс ЕТЕЕНАМЕЕ 
деїс 


Возвращает очередной байт из входного файла, прикрепленногс к ҒПЕНА№ІЕ. В по- 
зиции конца файла или при возникновении ошибки ввода/вывода возвращает 
ипадеѓ. Если дескриптор Ё ЕНАМІЕ опущен, чтение производится из 5Т01\. 


Эта функция несколько медлительна, но иногда полезна для ввода одиночных 
символов с клавиатуры - при условии, что ввод с клавиатуры не буферизован. Эта 
функция запрашивает небуферизованный ввод из стандартной библиотеки ввода/ 
вывода. К несчастью, стандартная библиотека ввода/вывода не настолько стан- 
дартна, чтобы обеспечить переносимый способ получить от операционной систе- 
мы небуферизованный ввод с клавиатуры для стандартной системы ввода/выво- 
да. Для этого придется проявить сообразительность, учесть особенности разных 
операционных систем. В О№ъМХ можно поступить так: 


ЇР ($850 ЅТҮЕ) { 

ѕуѕтет "іу сргеак </дем/тту >/еу/+іту 2>&1" 
} е1ѕе { 

зузтет “зу”, “-1сапоп“, “ео1“, “001” 
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$кеу = деїс, 


іҒ ($8$0_ЭТУЕЕ) { 
зузфет “ѕїіїу -сбгеак </дем/Еу >/деу/іїу 2>81"; 
} е1ѕе { 
зузфет “эТфу”, “1сапоп”, “е01”, “7@”; # АЅСІІ М 
} 
ргіпі "Хп"; 
Этот код помещает очередной символ, введенный с терминала, в строку $Кеу. Если 
программа зѓѓу поддерживает такой параметр, как сібгеак, потребуется использо- 
вать код, соответствующий истинному значению $В50_$ТҮІЕ. В противном случае 
придется использовать код, соответствующий ложному значению. Определение 
параметров $#(1) мы оставляем читателям в качестве упражнения. 


Модуль Р0$1Х предоставляет более переносимый вариант такой реализации по- 
средством функции Р05ІХ::0еїаїїіг. Более переносимый и гибкий подход можно 
также найти в модуле Тегт::ВеадКеу на ближайшем к вам сайте СРАМ. Вместо 
функции ипде{с можно использовать метод класса 10::Напа1е. 


деідгепї | 


деїдгепї 
ѕеїтагепї 
епдогепе 


Эти подпрограммы выполняют обход содержимого вашего (или чужого, если он 
находится где-то на сервере) файла /ек/ятоир. В списочном контексте деїдгепї 
возвращает: 


н о 1 2 З 
(Фпаме, $раѕѕма, $914, $тетбегз) = деїдгепїг); 


где $петрегѕ содержит список разделенных пробелами имен пользователей, чле- 
нов группы. Организовать хеш для перевода имен групп в СІР можно так: 


мпі1е (($пате, Фраззма, $914) = деїдгепї) { 
$019{Фпате} = $919; 
} 


В скалярном контексте деїдгепі возвращает только имя группы. Стандартный 
модуль ѕег::дгепі поддерживает интерфейс к этой функции через имена. См. сеї 
ятепиЗ). 


сеідгоіа ЕІ 
оетогодіа 610 


Ищет запись в файле групп по номеру группы. В списочном контексте возвращает: 


#0 1 2 3 
(Фпате, $раѕѕма, $919, Фтетбегѕ) 
= деїдгдіа(0): 


где $пепрегѕ содержит список разделенных пробелами имен пользователей, чле- 
нов группы. Если это необходимо делать неоднократно, подумайте о кэширова- 
нии данных в хеше с помощью деїдгепї. 
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В скалярном контексте 0еїдгдіс возвращает только имя группы. Модуль (/ѕег::дгепі 
поддерживает интерфейс к этой функции через имена. См. вета (3). 


деїдгпат Е 


дефдгпат МАМЕ 
Ищет запись в файле групп по имени группы. В списочном контексте возвращает: 


#0 1 2 3 
(%пате, Фраззма, $019, Фтетоегз) = 
дедгпат( “мпее1”); 


где $петрегѕ содержит список разделенных пробелами имен пользователей, чле- 
нов группы. Если приходится делать это неоднократно, подумайте о кэширова- 
нии данных в хеше с помощью деідгепї. 


В скалярном контексте детдгпат возвращает только числовой идентификатор 
группы. Модуль Џѕег::дгепі поддерживает интерфейс к этой функции через име- 
на. См. веёгпат(З). 


део$Буадаг 0. мх 
детһоѕруадаг АБО, АБОВТУРЕ 
Транслирует адреса в имена (и в альтернативные адреса). А000 должен быть упа- 


кованным двоичным сетевым адресом, а в аргументе АООЯТУРЕ на практике обыч- 
но передается АҒ ІМЕТ (из модуля Зоске!{). В списочном контексте возвращает: 


#0 1 2 3 4%. 
($пате, Фаллазез, Фадагеуре, $1епоїһ, @а0дгз) = 
детпоз{Буадаг($раскей_61пагу_а@9гезз, $аддгтуре); 


где вадагз является списком упакованных двоичных адресов. В домене Интернета 
каждый адрес (исторически) имеет длину четыре байта и может быть распако- 
ван, например, так: 


($а $0, $с, $а) = ипраск("С4° $аоагѕ[0]); 


Альтернативный вариант: прямое преобразование в нотацию вектора с точками 
с помощью модификатора у для ѕргіпїї: 


$0015 = зрг1пЕЁ “%\9”, $адагѕ[0]; 
Функцию 1пеї_птоа из модуля 50скеї удобно использовать при создании версии 


для вывода через ргіпї. Этот подход станет важным, если мы все когда-либо пе- 
рейдем на ТРуб. 


изе Ѕоскет; 

фргіпар1е абӣгеѕѕ = 1пет_птоа($ад9г$[01); 
В скалярном контексте де{поз1буад9г возвращает только имя хоста. 
Чтобы создать А008 из вектора с точками, сделайте так: 

изе Ѕоскеї; 


$ірадӣг = іпеї атоп(“127.0.0.1"); # 1оса1һоѕї 
$с1а1тед_позТпате = детһоѕїруадаг($1раоадг, АР _ІМЕТ); 
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Дополнительные примеры вы найдете в разделе «Сокеты» главы 15. Модуль 
М№еї::ћоѕіепї обеспечивает поддержку интерфейса к этой функции через имена. 
См. детозфуаааг(). 


Модуль боске{ содержит функцию деіћоѕііпѓо, поддерживающую адреса во всех 
распространенных форматах, включая ГРуб. 


Функция деїадігіпѓо используется для получения списка ІР-адресов и номеров 
портов для указанного хоста (и, возможно, имени службы), и обеспечивает ббль- 
шую гибкость, чем функции деіћоѕірупате(8) и дезегобупате(3). 


изе ЗоскеЕ ам(:а11); 
байӣг_ѕігисїѕ = детаддгіпғо(”127.0.0.1" 


); # петлевой адрес ТР\у4 
бадаг _ѕігисіѕ = детадагіп?о( "207. 171.7. 72"); 


@айӣг_ѕїгисїѕ = детаддгіпғо(" : :1”); # петлевой адрес ІРуб 
бадаг ѕігисїѕ = деаддгіпғо(“е80: :223:12##: #е58:714с"); 


м у 

деіћоѕїрупате А е 
детћоѕїірупате МАМЕ 

Транслирует сетевое имя хоста в соответствующие адреса (и другие имена). В спи- 

сочном контексте возвращает значение: 


#0 а 2 3 4. 
(Фпате, $а1іаѕеѕ, $айаг+уре, $1епоїһ, @аддг$з) = 
детпоз%Бупате ( $гетоте_позфпате); 


где @адігѕ — список «сырых» адресов. В домене Интернета каждый адрес (истори- 
чески) имеет длину четыре байта и может быть распакован, например, так: 


($а, $6, $с, $49) - ипраск(“”С4”, $адагѕ[0]); 
Адрес можно непосредственно преобразовать в нотацию вектора с точками с по- 
мощью модификатора у для 5ргіпїѓ: 
$0015 = эрг1піғ "уа", $адагѕ[01; 
В скалярном контексте деїћоѕїрупапе возвращает только адрес хоста: 


иѕе Зоскет; 

$1іраддг = детпозтБупамте( $гетоте_по$т); 

ргіпі? “№5 һаѕ айагеѕѕ %$\п”, 
фгетоте_һоѕї, іпеЁ_піоа($ірадаг), 


О другом подходе рассказано в разделе «Сокеты» главы 15. Модуль М№еї::поѕїепї 
обеспечивает поддержку интерфейса к этой функции через имена. См. также 
Беіћоѕупате(8). 


деїћоѕќепі ЕТ 


детһоѕтепї 
зетпозтепт ЅТАҮОРЕМ 
епдһоѕтепї 


Эти функции осуществляют итерации по файлу /еѓс/ћоѕіѕ и возвращают каждый 
раз по одной записи. Функция деїћоѕїепї возвращает значение: 


($пате, $а1іаѕеѕ, $адбагїуре, $1епоїһ, @ад9г$) 
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где бадйгѕ является списком «сырых» адресов. В домене Интернета каждый адрес 
(исторически) имеет длину четыре байта и может быть распакован, например, так: 


($а, $6, Фс $9) = ипраск(”С4”, $адаг$[0]): 


Сценарии, содержащие вызов деїпоѕїепї, не следует считать переносимыми. Если 
система использует сервер имен, ей придется опросить большую часть Интерне- 
та, чтобы удовлетворить запрос всех адресов всех компьютеров на свете. Поэтому 
детпозтепЕ не реализована в таких системах. Другие подробности можно найти 
в описании &еѓћоѕіепі(8). 


Модуль М№ї::һоѕїепі обеспечивает поддержку интерфейса к этой функции через 
имена. 


деНодіп 7 
деї1оділ 


Возвращает имя текущего пользователя, если оно найдено. В ОМІХ-системах оно 
извлекается из файла иітр(5). Если возвращает ложное значение, используйте 
деїрмиіа. Например: 


$10діп = беї10одіп() || (9еїрми10($<))[0] || “Нарушитель! ! “ 


деїпеїруаааг 
уеспеїруадӣг АРрв. АРрАТҮРЕ 


= 


Транслирует сетевой адрес в соответствующее сетевое имя или имена. В списоч- 
ном контексте возвращает значение: 


иѕе боскет; 
($пате, $а11аѕеѕ, $айагїуре, $пеї) - деїпе+руадаг( 127, АЕ_ТМЕТ) 


В скалярном контексте возвращает сетевое имя. Модуль №ї::пеќепї обеспечивает 
поддержку интерфейса к этой функции через имена. См. вете#Фуааап 3). 


деїпеїрупате ЕД" 
деіпетрупате МАМЕ 


Транслирует сетевое имя в соответствующий сетевой адрес. В списочном контек- 
сте возвращает значение: 


($пате. $а11аѕеѕ, Фадбагтуре. $пеї) = детпетоупаме( "1оорбаск” ); 


В скалярном контексте возвращает только сетевой адрес. Модуль №1: :петеп{ обес- 
печивает поддержку интерфейса к этой функции через имена. См. деѓпеірупа- 
те(3). 


беїпеїепї Г] 


детпетепї 
ѕеїіпеепі ОТАҮОРЕМ 
епапетепі 


Эти функции осуществляют перебор записей файла /еёс/пейрогЁз. В списочном 
контексте возвращают значение: 
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($пате, $а11азез, Фадагтуре, $пеї) = детпетепт() 


В скалярном контексте деїпеіегі возвращает только сетевое имя. Модуль №еї::пе- 
Тепї обеспечивает поддержку интерфейса к этой функции через имена. См. дете- 
ѓіепі(8). 


Концепция сетевых имен кажется в наше время довольно странной; большинст- 
во ІР-адресов находится в неименованных (и неименуемых) подсетях. 


деѓреегпате Я [аксу 0. 
детреегпате 50СКЕТ 


Возвращает упакованный адрес сокета противоположного конца соединения 
ЗОСКЕТ. Например: 


иѕе Зоскет; 
$негзоскадаг = деїреегпате $0СК; 
($рогї, Фпегабдг) = зоскаддг іп($һегѕоскадаг); 
$һегһоѕтпате = деїћоѕтбруаддг($һегабӣг, АЕ_ІМЕТ); 
фһегѕёгадаг = іпеї_пёоа($ћегадаг); 
ях 
дерг сн 


детрогр РТО 


Возвращает текущую группу процессов для указанного РГ) (для текущего про- 
цесса исиользуйте РТО, равный 0). Вызов деїрдгр вызывает исключение в сисге- 
мах, где не реализована деретр(2). Если параметр РІО опущен, функция возвра- 
щает группу процессов текущего процесса (то же, что при РПО, равном 0). В систе- 
мах, реализующих этот оператор через системный вызов РОЅІХ вератр(2), РТО 
следует опускать или назначать ему нулевое значение. 


деїрріа ЕІ 
бдеіррід 


Возвращает идентификатор родительского процесса. В типичной системе СМІХ, 
когда идентификатор родительского процесса изменяется и принимает значе- 
ние 1, это означает, что первоначальный родительский процесс завершился, и ро- 
дителем стала программа #118). 


дерпогку Я ЕЕ 


деїргіогіїу ИНТСН, ИНО 


Возвращает текущий приоритет процесса, группы процессов или пользователя. 
См. вефртогиу(2). Вызов деїргіогіїу вызывает исключение в системах, где не реа- 
лизована дертогйи(?). 


Модуль В$0: :Везоигсе в СРАМ предоставляет более удобный интерфейс, в том числе 
символические константы РАТО_РВОСЕЗ$, РАТО_РСВР и РВІО 5ЕВ для передачи в аргу- 
менте ИНІСН. Хотя обычно они равны 0, 1 и 2 соответственно, никогда не знаешь, что 
произойдет в темных недрах #1пс1и0е-файлов стандартной библиотеки языка С. 
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Значение 0 в аргументе ИНО означает текущий процесс, группу процессов или 
пользователя, поэтому получить приоритет текущего процесса можно так: 


$сигргіо = деїргіогіту(0, 0); 


детрготобупате Сы, 
деірготобупате МАМЕ ТР 
Транслирует имя протокола в соответствующий номер протокола. В списочном 
контексте возвращает следующее значение: 
($пате, $а1іаѕеѕ. Фргофосо1_питбег) = деірготобупате( "ср" ) 


В скалярном контексте возвращает только номер протокола. Модуль М№еї::ргоїо 
поддерживает интерфейс к этой функции через имена. См. дергоюфупате(3). 


детргоќорупитбег 1 | 
деірготорупитбег МИМВЕВ 
Транслирует номер протокола в соответствующее имя протокола. В списочном 
контексте возвращает следующее значение: 
во 1 2 


(Фпате, $а1іаѕеѕ, Фргоёосо] питбег) = деїргоёобупитрег(6); 


В скалярном контексте возвращает только имя протокола. Модуль №еї::ргоїо под- 
держивает интерфейс к этой функции через имена. См. дергообупитёфег (3). 


детрготоет ут 


деїргоїоепї 
ѕеїрготоепі 5ТАУОРЕМ 
епаргоїоепї 


Эти функции осуществляют перебор записей файла /еѓс/ргоѓосоіз. В списочном 
контексте деїргоїоепї возвращает значение: 


#0 1 2 
(Фпате, $а1іаѕеѕ. $ргоїосо1 питрег) = деёргоїоепі(): 


В скалярном контексте деїргоїоепї возвращает только имя протокола. Модуль 
Мег: :ргото поддерживает интерфейс к этой функции через имена. См. бергоепИЗ). 


деёрмепї [71%] 


детрмепЕ 
ѕеїрмепі 
епдрмепї 


|= 
= < 


Эти функции осуществляют перебор записей файла /еёс/раззша, при этом в рабо- 
ту может вовлекаться также файл /еѓс/ѕрайош, если функции вызываются с при- 
вилегиями суперпользователя, а в системе используется теневой файл паролей. 
Ситуация может осложниться при использовании системы регистрации, осно- 
ванной на базе данных или сетевых ресурсах. В списочном контексте возвращает 
следующее значение: 
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#0 1 2 3 4 5 6 7 8 
($пате, $раѕѕма, Физа, $914, Фаиота, $соттепт, $9с0$, $61г, $$Не11) = деїрмепі(); 


В некоторых системах поля квоты и комментария ($9џоїа и $соттеп{) могут ис- 
пользоваться с другими целями, чем указывают их имена, но остальные поля 
всегда имеют ожидаемые значения. Чтобы создать хеш для трансляции имен 
пользователей в ОТ), сделайте так: 


мһі1е ((Фпате, $раззма, $010) = деїрмепі()) { 
$и19{Фпате} = $и19; 
} 
В скалярном контексте возвращает только имя пользователя. Модуль ег: :рмепі 
поддерживает интерфейс к этой функции через имена. См. де ршепЦиЗ). 


деїрмпат Л" 


деїрипат МАМЕ 


Транслирует имя пользователя в соответствующую запись файла /ес/раззша. 
В списочном контексте возвращает следующее значение: 
о 1 2 3 4 5 6 7 8 


($папе, $раѕзма, $и19, $914, Фдиота, $соттепт, $9с0$, $01г, $$ће11) 
= деїрмпат(“даетоп”); 


В системах, поддерживающих теневые пароли, для извлечения фактического па- 
роля нужно иметь привилегии суперпользователя. Библиотека языка С должна 
проверить, что имеющихся привилегий достаточно, и открыть файл /еѓс/ѕћааош 
(или тот, где хранятся теневые пароли). По крайней мере, так она должна работать. 


Для многократного поиска можно кэшировать данные с помощью де+рмепї. 


В скалярном контексте возвращает только числовой идентификатор пользова- 
теля. Модуль (ѕег::риепі поддерживает интерфейс к этой функции через имена. 
См. веірипат(8) и раѕѕша(5). 


деќрууиіа т] 


деїрмиід ОТО 


Транслирует числовой идентификатор пользователя в соответствующую запись 
файла /еѓс/раѕзѕиа. В сиисочном контексте возвращает следующее значение: 


о І 2 К 4 5 6 7 8 
($пате, Фраѕѕиа, $иіа, $919, Фаиота, Фсоттепе, $осоѕ, $0іг, $%ће11) = дерми19(2); 


Для многократного поиска можно кэшировать данные с помощью деїрмепї. 


В скалярном контексте возвращает имя пользователя. Модуль (ѕег::рмепї поддер- 
живает интерфейс к этой функции через имена. См. веёрипат(3) и раѕѕша(5). 


дебегурупате уе 
детзегурупате МАМЕ, РАОТО 
Транслирует имя службы (порта) в соответствующий номер порта. В аргументе 


РВОТО передается имя протокола; например, "їср". В списочном контексте возвра- 
щает следующее значение: 
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#0 1 2 3 
($пате, $а11азез, $рогї питрег, Фргофосо]_пате) = детзегубупате (“ммм , “Еср”); 


В скалярном контексте возвращает только номер порта службы. Модуль № ет: :зег- 
епі поддерживает интерфейс к этой функции через имена. См. сеѓѕегођбупате(38). 


ЕЯ 
деїѕегубурогї х] 
беїѕегурурогі РОРТ, РВОТО 


Транслирует номер службы (порта) в соответствующее имя. В аргументе РЕ070 пе- 
редается имя протокола; например, `їср’. В списочном контексте возвращает сле- 
дующее значение: 


о 1 2 3 
($пате, $а1іаѕеѕ, $рогї питрег, $ргоёосо1 пате) = деїѕегмрурогі(8С, "їср"); 


В скалярном контексте возвращает только имя службы. Модуль №1: :зегуеп{ под- 
держивает интерфейс к этой функции через имена. См. дезегобурогиЗ). 


Х 
деќѕегуепї 17 
деїѕегуепі 
ѕеїѕегмепї 5ТАУОРЕМ 
епдѕегмепі 


Выполняет перебор записей файла /еѓс/ѕегиісеѕ или эквивалентного ему. В спи- 
сочном контексте возвращает следующее значение: 


о 1 2 К 
($пате, Фа1зазез, $рогїі питрег, $ргоіосо1 пате) = детзегуепт(); 


В скалярном контексте возвращает только номер порта службы. Модуль №еї::ѕег- 
уепї поддерживает интерфейс к этой функции через имена. См. веѓѕегоепі(3). 


деќѕоскпате АА 
деїѕоскпапе Ѕ0СКЕТ 


Возвращает упакованный адрес сокета указанного конца соединения 50СКЕТ. 
(А почему вы до сих пор не знаете свой собственный адрес? Может быть, потому, 
что привязали адрес, содержащий групповые символы, к сокету сервера перед 
выполнением ассерї, и теперь хотите узнать, какой интерфейс кто-то использо- 
вал для соединения с вами. Либо сокет был передан вам родительским процес- 
сом, например тега.) 


изе Ѕоскеї; 

# предполагается, что 50СК - это сокет установленного соединения 
Фпуѕоскаддг = деїѕоскпате( 50СК); 

($рогї, $туайдг) = зоскаддг_1п($тузоскадаг), 

$тупате = десћоѕтруаааг($туайдг, АЕ ІМЕТ); 

ргіпіё “Т ат %$ [%м9]\п”, Фпупате, $туаадаг; 
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деќѕоскорі Е | 


деїѕоскорі Ѕ0ОСКЕТ, ЕЕУЕЁ, ОРТМАМЕ 


Возвращает значение параметра ОРТМАМЕ сокета 50СКЕТ на указанном уровне / ЕЕ. 
или ипдеР в случае ошибки. Параметры могут существовать на нескольких уров- 
нях протокола, в зависимости от типа сокета, но как минимум они определены на 
высшем уровне 501 _50СКЕТ (определяется в модуле Ѕ50скеї). Чтобы запросить пара- 
метры на другом уровне, необходимо указать номер соответствующего протоко- 
ла, управляющего параметром. Например, чтобы указать, что требуется полу: 
чить параметр на уровне протокола ТСР, в аргументе [ЕЕ следует передать но- 
мер протокола ТСР, который можно получить вызовом деїргоїобупате. 


Возвращает упакованное строковое представление запрошенного параметра со- 
кета или, в случае ошибки, ипе? – и описание ошибки в $!. Содержимое упако- 
ванной строки зависит от аргументов [Е\УЕЁ и ОРТМАМЕ; подробности вы найдете на 
странице де15оскорН2). Но чаще значение параметра — это целое число, которое 
можно распаковать с применением формата і” (или “Т"). 


Например, чтобы проверить, включен ли алгоритм Нейгла (Ма]е) в сокете: 


изе Ѕоскет дм( :а11); 


# предполагается, что сокет $ѕоскеї хранит указатель сокета 
# для установленного соединения 
$1ср = ТРРНОТО_ТСР; 
фраскед = деїѕоскорї($ѕоскеї, $1ср. ТСР_М№ОРЕІГАҮ) 
|| 91е “деїѕоскорі. $1”; 
фподе1ау = ипраск( "І", $раскеа); 
ргіпіғ "Алгоритм Нейгла (№91е) в%з.\п”. $поде1ау ? “ыкл. "кл." 


См. дополнительные сведения в описании ѕеіѕоскорї. 


соь Зет 
9106 ЕХРЯ 
9106 


Возвращает список имен файлов, соответствующих шаблону ЕХРА, как это делает 
интерпретатор команд (һе). Это – внутренняя функция, реализующая опера- 
тор <*>, 


В силу исторических причин алгоритм работы этой функции соответствует алго- 
ритму расширения в оболочке с5й(1), а не в оболочке Борна. Имена файлов, начи- 
нающиеся точкой (.), игнорируются, если только точка не задана в шаблоне явно. 
Звездочка (х) соответствует любой последовательности любых символов (в том 
числе отсутствию символов). Вопросительный знак (?) соответствует любому 
единственному символу. Последовательность в квадратных скобках ([ ]) задает 
простой класс символов, например `[сћу0-9]". Классы символов могут инвертиро- 
ваться с помощью знака крышки (°), как в ”».[^оа]", что соответствует любым фай- 
лам, имена которых начинаются не с точки, в именах которых есть точка, за ко- 
торой следует один символ, отличный от "а" и “0”, и являющийся последним 
в имени. Тильда (-) расширяется в домашний каталог пользователя. Например, 
”-/.*гс” выберет все гс-файлы текущего пользователя, а “-]апе/Ма11/*” — все почто- 
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вые файлы пользователя Јапе. Фигурные скобки можно использовать для пере- 
числения альтернатив, как в случае "-/.{та11,ех,сѕћһ,їмт,}гс" для получения кон- 
кретных гс-файлов. 


Функция 0100 исстари использует пробелы для разделения нескольких шабло- 
нов, например <*.с *.1>. Чтобы осуществлять поиск имен файлов, которые могут 
содержать пробельные символы, шаблоны необходимо заключать в кавычки. На- 
пример, чтобы найти файлы, имена которых содержат символ "є", за которым 
следует пробел и символ "Г", можно использовать такие шаблоны: 


@ѕрасіеѕ = <"+е Ғғ">; 
@ърас1ез = 0100 '"+е Ё*”`; 
@ѕрасіеѕ = 9106 9(“”*е Ғ*"), 


Если потребуется добавить в шаблон содержимое переменной, это можно сделать 
так: 


@ѕрасіеѕ = 9106 —‘’„${уаг}е #*' , 
@ѕрасіеѕ = 9106 99(“*${маг}е Ғ»”); 


Можно также воспользоваться модулем Еі1е::6:00; более подробную информацию 
о нем вы найдете на страницах справочного руководства (тапраге). Вызов 9100 
или оператора <> автоматически приводит к использованию этого модуля, поэто- 
му, если этот модуль неожиданным образом испарится из вашей библиотеки, воз- 
никнет исключение. 


При вызове функции ореп Рей не проводит подстановку метасимволов в именах 
файлов, даже тильд. Поэтому предварительно необходимо вызвать 0100: 


ореп(МАТЕВС, “-/.та11гс”) # ОШИБКА: тильда попадает в интерпретатор команд 
|| 91е "невозожно открыть -/.ма11гс: $!"; 

ореп(МАТЕНС, <-/.та11гс>) # сначала расширить тильду 
|| діе “невозможно открыть -/.таі1гс: $1”; 

ореп(МАТЬЕВС, (9106(“-/.та11гс”))[0]) # то же самое, но будьте внимательны 
|| діе "невозможно открыгь -/.ма11гс: $!" # 9106 возвращает список 


Если непустые фигурные скобки — единственные групповые символы в вызове 
9106, поиск имен файлов не производится, но может возвращаться множество 
строк. Например, следующая инструкция вернет девять строк, по одной на каж- 
дое сочетание фрукта и цвета: 


@тапу = 9106 "{арр1е. сотаїо, сһеггу}={огееп, уе110м, гей}; 


Функция 9106 не связана с понятием переменных іуреғр1оЬ в Регі, если не считать 
того, что в обоих случаях символ + служит для представления группы объектов. 


См. также раздел «Поиск файлов по шаблону» главы 2. 


атте 


оттіте ЕХРВ 
отііте 


Преобразует значение времени, возвращаемое функцией їіпе, в список из девяти 
элементов, представляющих время по Гринвичу (также известное как СМТ), ны- 
не известное как всемирное координированное время (Соогдіпаќеа Опіуегѕа! Ті- 
те, ОТС). Обычно она используется так: 
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#0 1 2 3 4 5 6 7 8 
($зес, $тіп, ФПоиг, $тдау, $топ, Фуеаг, $идау , $уйау, $15051) = отііте; 


Если опустить аргумент ЕХРА, выполняется вызов он{лие({1ие()). Модуль из биб- 
лиотеки Ре! Т1те::1оса1 содержит подпрограмму +іпедт, которая может преобра- 
зовать список обратно в значение времени. 


Все элементы списка являются числами и берутся прямо из ѕігисї їп (это про- 
граммная структура С - не волнуйтесь). В частности, это означает, что $поп имеет 
диапазон 0..11, причем январю соответствует номер 0, мау имеет диапазон 0..6, 
а воскресенью соответствует номер 0. Несложно запомнить, какие величины име- 
ют нумерацию с нуля, поскольку именно они всегда служат индексами массивов, 
содержащих названия месяцев и дней недели и также имеющих нумерацию 
с нуля. 


Например, получить текущий месяц в Лондоне можно так: 


$1 опдоп_шопЕН = (ам(Јап Реб Маг Арг Мау Јип 
Уи Аџд Ѕер Осі М№у рес) ) [(опсіте [41]; 


фуеаг — это число лет, прошедших после 1900; т.е. в 2023 году $уеаг будет иметь 
значение 123, а не просто 23. Чтобы получить четырехзначный год, просто скажи- 
те $уеаг + 1900. Чтобы получить двузначный год (например, «01» в 2001 году), ис- 
пользуйте вызов ѕргіпіћ("%020", Фуеаг % 100). 


В скалярном контексте дпііпе возвращает строку в стиле сНте(3), основанную на 
значении времени СМТ. Модуль Тіпе::дтііпе поддерживает интерфейс к этой 
функции через имена. В описании функции Р05ІХ::5їгѓііте изложен подход к фор- 
матированию времени, дающий большую степень контроля. 


Это скалярное значение не зависит от национальных настроек, а является встро- 
енным для Рег]. См. также модуль Т1те::10оса1 и функции зігѓііте(3) и тёНте(3) 
в модуле Р051Х. Чтобы получить сходные строки даты, не зависящие от нацио- 
нальных настроек, присвойте надлежащие значения переменным среды, управ- 
ляющим национальными настройками (прочитайте, пожалуйста, страницу ру- 
ководства регіосаіе) и попробуйте: 


изе РОЅІХ ом(ѕігЕёіте); 
фпом_Ѕїгіпо = ѕтг?ёіте “а %6 Же #Н:%М:%5 ЖҮ”, отгіте, 


Управляющие последовательности Фа и %Б, представляющие сокращенные формы 
дня недели и месяца года, не для всех национальных настроек будут трехсим- 
вольными. 


доїо в@ 
дото [АВЕ 
дото ЕХРЯ 
дото &МАМЕ 


дото [АВЕ находит инструкцию с меткой [АВЕЁ и продолжает выполнение с нее. 
Если [ АВЕ! не найдена, возникает исключение. Нельзя использовать эту функцию 
для входа в конструкцию, требующую инициализации, например, подпрограм- 
му или цикл Гогеасп. Нельзя также с ее помощью входить в конструкцию, удален- 
ную в результате оптимизации. Она пригодна для перехода почти в любую точку 
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в динамической области видимости!, в том числе из подпрограмм, но для этой це- 
ли обычно лучше применять какую-либо другую конструкцию, например ]аѕі 
или діе. Автор Ре! никогда не испытывал потребности в этой форме 0010, когда 
писал на Рен (а язык С – другое дело). 


Достигая еще больших вершин ортогональности (и глубин идиотизма), Рег! под- 
держивает форму доїо ЕХРП, где значением выражения ЕХРЯ может быть имя мет- 
ки, местонахождение которой гарантированно не известно до этапа выполнения, 
поскольку метка неизвестна на этапе компилнции. Это позволяет применять вы- 
числяемые метки в операторе 9010, как в ГОВТВАМ, хотя делать это мы не реко- 
мендуем, если вы стремитесь повысить удобство сопровождения ваших программ: 


дото +("РОО”, “ВАА”, “6ЁАВСН”)[$11; 


Стоящая особняком форма доїо &ЛАМ таит особое волшебство, заменяя вызов ука- 
занной подпрограммы на подпрограмму, выполняющуюся в данный момент. Эту 
конструкцию не стыдно использовать в подпрограммах АЦТО! ОАО, которым нужно 
загрузить другую подпрограмму, а затем представить дело так, будто в первую 
очередь была вызвана эта новая подпрограмма, а не первоначальная (только все 
изменения @_в исходной подпрограмме распространяются в заменяющую). По- 
сле 90% даже са11ег не сможет определить, что первой была вызвана подпрограм- 
ма АЏТОГОАР. 


агер 
дгер ЕХРА, [ІТ 
Огер ВЕОСК 11Т 


Вычисляет ЕХРА или В/ОСК в логическом контексте для каждого элемента / 157, по- 
очередно присваивая переменной $_ значение каждого элемента, подобно конструк- 
ции Гогеасн. В списочном контексте возвращает список элементов, для которых вы- 
ражение вернуло истинное значение. (Оператор назван в честь любимой програм- 
мы ОМГХ, извлекающей из файлов строки, соответствующие заданному шаблону. 
В Рей выражение часто является шаблоном, но не обязано им быть.) В скалярном 
контексте возвращает число элементов, для которых выражение было истинным. 


Если предположить, что @а11_11пе5 содержит строки кода. следующий пример 
удалит строки комментариев: 


@соое 11пеѕ = дгер !/7\$*+#/, @а11 11пеѕ; 


Поскольку $_ представляет собой неявный псевдоним для каждого значения в спи- 
ске, изменение $ вызывает изменение элементов исходного списка. Такое свойст- 
во полезно и поддерживается, но иногда приводит к результатам, которые могут 
оказаться странными и неожиданными. Например: 


61151 = ди(Багпеу Ёгед 91по мі1та); 
@огер1іѕі = дгер { 5/7[0ға]// } 61151; 


@9гер115ї1 теперь содержит «агпеу», «гей», «іпо», но @1151 содержит «агпеу», «гей», 
«іпо», «міітпа»! Программист, Будь Осторожен. 


1 Этозначит, что если метка не находится в текущей подпрограмме, осуществляется об- 


ратный поиск метки в подпрограммах, вызвавших данную, что делает почти невоз- 
можным сопровождение вашей программы. 
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См. также пар. Следующие две инструкции функционально эквивалентны: 


@оиТ = дгер { ЕХРВ } @іп; 
@оиї = тар { ЕХРВ ? $_. () р @іп 


Если потребуется версия огер, производящая вычисления по короткой схеме, об- 
ратите внимание на функцию 11г51 из стандартного модуля [151::1411. Вместо 
списка всех элементов, для которых выражение ЕХРВ вернет истинное значение, 
она возвращает только первый такой элемент или ипдет, если нет ни одного эле- 
мента, соответствующего условию. Как всегда, в переменную $_ записывается 
каждый элемент: 


иѕе 1151: :0411 дм(Е1г$%); 


$Е1гэт_омег_100 = Ғігѕї { $ > 100 } @115ї; 
ФҒігѕё міїһ Ғоо = Ғігѕё { /Ғоо/ } @1151; 


А следующая функция принимает единственный символ и сообщает, в какой 
версии стандарта Юникода он появился впервые: 


џѕе 5.14; 
иѕе 1151: :0111 9м(Е1г$т); 
зиб четаче(_) { 
ту $опе_спаг = 5ћіҒ+; 
діє ипезз 1епоїћ(Фопе_сіпаг) == 1; 
зфате $адеѕ = [гемегзе 9и(1.* 2.0 2.1 3. 
4.0 4.1 5.0 5. 
)]; 
гетигп ігі { $опе сһаг =- /Ар{Аде=$_}/ } @$ауьз, 


0 3.13,2 
15.2 6.0 


} 


һех [| 


пех ЕХРЕ 
пех 


Интерпретирует ЕХРЕ как шестнадцатеричную строку и возвращает эквивалент- 
ное десятичное значение. Приставка 0х, если она есть, игнорируется. Для интер- 
претации строк, которые могут начинаться числовым префиксом 0, 06 или 0х, ис- 
пользуйте осї. Следующая инструкция присвоит $пипбег значение 4 294 906 560: 


Фпитбег = пех("#?Ё?12с0"); 
Обратное преобразование можно выполнить посредством ѕргіпїёѓ: 
эрг1пЕР "%1х”, Фпитбег; # (1 - буква, а не цифра. ) 


Шестнадцатеричные строки могут представлять только целые числа. Строки, 
вызывающие переполнение целых, вызывают исключение. 


ітрогї 
ітрогі СІАЅЅМАМЕ [167 
прог СЕАЗЗМАМЕ 


Встроенной функции іпрогї не существует. Это – обычный метод класса, опре- 
деляемый (или наследуемый) модулями, которые хотят экспортировать имена 
в другой модуль посредством оператора иѕе. Подробности см. в описании изе. 
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іпдех 


іпдех 578, 50В5ТВ, ОРЕЗЕТ 
іпдех 578. 5/85ТВ 


Ищет одну строку в другой. Возвращает позицию первого вхождения 51/8579 в 579. 
Смещение 0ҒЕЅЕТ, если задано, определяет, сколько символов от начала пропус- 
тить, прежде чем начать поиск. Позиции нумеруются с 0. Если подстрока не най- 
дена, функция возвращает число, на единицу меньшее основания, т.е. обычно -1. 
Чтобы просмотреть всю строку, можно сделать так: 

$роѕ = -1; 

пе (($роѕ = 1пдех($$+г1па, $10окҒог, $роѕ)) > -1) { 

ргіпі "Найдено в позиции $роѕ\п“; $ро$++; 


} 


Смещения всегда выражаются в символах, доступных программисту (т.е. в ко- 
дах), а не в графемах, которые видит пользователь. Смещение выражается в бай- 
тах, только если вы уже выполнили декодирование абстрактных символов в не- 
которую конкретную кодировку, такую как ОТЕ-8 или ОТЕ-16. См. главу 6. 


Работать со строками, как с последовательнос:нми графем, а не кодов, можно 
с помощью методов пех, гіпіех и роз из модуля Џпісоде::6С5їгіпо, опубликованно- 
о в СРАМ. 


іл 15| 


іпі ЁХРА 
іп 


Возвращает целую часть ЕХРЯ. Программисты на С склонны забывать о примене- 
нии 111 в сочетании с делением, которое в Рей является операцией с плавающей 
запятой: 


$ауегаде_аде = 939/16; # дает 58.6875 (58 в языке С) 
$ауегаде_аде = 1п{ 939/16; # дает 58 


Не следует использовать эту функцию для обычного округления, потому что 
она усекает результат в сторону 0, а машинное представление чисел с плаваю- 
щей запятой может иногда приводить к неочевидным результатам. Например, 
1п1(-6.725/0.025) вернет -268, а не правильное -269, так как операция деления в дей- 
ствительности дает что-то вроде -268.99999999999994315658. В большинстве случаев 
следует предпочесть функции ѕргіпі?, ргіпт? или РО5ІХ::Р1оог и РО5ІХ::сеі1, а не іпї. 


фп = эргіп?(“%.0Ғ", $Р), # округление (а не усечение) до ближайшего целого 


Чтобы компенсировать смещение, которое всегда вызывает округление дробной 
части .5 в большую сторону, ІЕЕЕ требует. чтобы округление выполнялось в на- 
правлении ближайшего четного числа. Поэтому следующая инструкция: 


Рог (-3 . 3) { ргіпс? "%.0#\п", $_ + 0.5 } 


выведет последовательность -2, -2, -0, 0, 2, 2 и4. 
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А пророзрс 
Іосі Г Ас | во ТГУ 
10611 РТЬЕНАМОЕЕ. РОМСТТОМ, ЅСАГАВ 


Реализует системный вызов іосі[(2), управляющий вводом-выводом. Чтобы полу- 
чить правильные определения функций, вначале, вероятно, придется сказать: 


гедиіге 5уѕ/10с11. ри”; # возможно, /иѕг/10са1/11р/рег1/5уѕ/10сї1. рћ 


Если зузЛюсН.рВ не существует или не содержит правильных определений, при- 
дется создать собственные, используя существующие заголовочные файлы С, на- 
пример 5у8/іосії.ћ. (Дистрибутив Рег! содержит сценарий с именем #2рй, который 
поможет вам это сделать, но запускается он нетривиальнс.) С аргументом 5САГАВ 
будет выполнена операция чтения или записи (или обе), в зависимости от Р/МСТІОЋ. 
Указатель на строковое значение в аргументе 5САЕАЯ будет передан в третьем аргу- 
менте в фактический вызов іосі (2). Если 5САЁАЯ имеет не строковое, а числовое 
значение, в вызов будет передано непосредственно это значение, а не указатель на 
строку. Для работы со значениями в структурах, используемых іосї1, хорошо 
подходят функции раск и џпраск. Если функция іосї1 должна записать данные 
в САГАА, необходимо гарантировать, что строка имеет достаточную длину, чего 
можно добиться, инициализировав строку фиктивными данными нужной длины 
с помощью раск. В следующем примере с помощью ГТОМВЕАО 10с11 определяется, 
сколько байтов (не символов) доступно для чтения: 


геди1ге ”5уз/10с1.ри”; 


# выделить буфер достаточного размера 
фѕіғе = раск(”", 0); 
іос+1(ЕН, РТОМВЕАО(), $312е) 
|| 91е “Невозможно выполнить 10611: $!\п”; 
$512е = ипраск( “Е”, $$17е); 


Ниже показано, как определить текущий размер окна! в строках и столбцах: 


гедиіге “ѕуѕ/іосі1.рћ“; 


# четыре коротких целых без знак& (ипѕ1дпеа >һугї) 
$Тетр1ате = "8!4"; 


# выделить буфер достаточного размера 
ту $из = раск(фёетр1ате, ()); 
іосї1 (ТООТ, ТІОСОМТМ№7(), $5) 
|| 91е "Невозможно выполнить іосї1. $! "; 
($гомѕ, $с019, $храх, $уріх) = опраск($+етр1ате, $5); 


Если сценарий #2рй не установлен или не работает, можете поискать его с помо- 
щью &гер во включаемых файлах вручную или написать маленькую программу 
на С для вывода значения. Выяснить формат структуры и требуемый размер для 
вашей системы можно также, заглянув в программный код на С. 


Функции 10С11 и Гсп{1 возвращают значения, перечисленные ғ табл. 21.2. 


1 Точнее, как получить размер окна, связанного с дескриптором файла $ТО0ЦТ. 
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Таблица 27.2. Значения, возвращаемые фупкцией 10сН 


І 
Значения, возвращаемые системным вызовом ‚Значения, возвращаемые Регі 


-1 упаде? 
0 строка "0 Би{ їгие' 
все прочее это же число 


Таким образом, Рег возвращает истинное значение при успехе и ложное при не- 
удаче, хотя сохраняется возможность определить фактическое значение, полу- 
ченное от операционной системы: 


$геф\уа1 = іосї1(...) || -1; 
ргіпЕ? "іосї1 фактически вернула %0\п”, $геїіча1; 


Специальная строка "0 Бит їгие" избавляет от предупреждений о недопустимых 
числовых преобразованиях при использовании ключа командной строки -ш или 
прагмы магпіпд5. 


Вызовы іосї1 нельзя считать переносимыми. Если, скажем, требуется просто от- 
ключить эхо-вывод для всего сценария, вот более переносимый способ: 


ѕзуѕет "ѕі су -еспо”; # Рабогает в большинстве систем МІХ. 


Если вы можете делать что-то в Регі, это не значит, что вы должны это делать. 
Лучшую переносимость можно обеспечить с помощью модуля Тегпт::НеадКеу из 
СРАМ. Практически для любых операций, где могла бы потребоваться функция 
10сї1, в архиве СРАМ существуют отдельные модули, реализующие те же опера- 
ции - и более переносимым способом, поскольку они, как правило, перекладыва- 
ют тяжелую работу на системный компилятор С. 


ют 
јо1п ЕХРЯ, 119Т 


Соединяет отдельные строки из списка / 157 в одну строку, разделяя их значением 
ЕХРВ, и возвращает эту строку. Например: 


фгес = јоіп " $10діп, $раѕѕме, $010, $010, $9соѕ, $һопе, $5һе11, 


Обратный эффект дает функция $р11{. Объединение элементов в поля с фиксиро- 
ванными позициями рассмотрено в описании функции раск. Наиболее эффектив- 
ный способ слияния строк это их объединение (јоіп) с пустой строкой в качестве 
разделителя: 


$ѕ1г1пд = јоіп “”, @аггау; 


В отличие от $р111, јоіп не принимает шаблон в первом аргументе. Если вы попы- 
таетесь это сделать, возникнет исключение. 


Кеуѕ йе 


Кеуз НАЗН 
Кеуз АВВАУ 
кеуѕ ЕХРА 
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Возвращает список всех ключей заданного хеша НАЗН. Ключи возвращаются в по- 
рядке, кажущемся случайным, но это тот же порядок, который создают функ- 
ции \а1иез и еасћ (в предположении, что хеш не изменялся между вызовами). 
В качестве побочного эффекта данная функция сбрасывает итератор хеша НАЗН. 
Вот (довольно примитивный) способ вывести переменные среды: 


@кеуз Кеуз ЖЕМ, # ключи следуют в том же порядке, что и 
@\уа1иез = уа1иез ЕМУ; # значения, как видно из вывода этого кода 
мһі1е (@кеуѕ) { 

ѕау рор(@Кеуз), "=", рор(ёуаіиеѕ); 
} 


Часто желательно при выводе окружения выполнять сортировку по ключам: 


Ғогеасһ Фкеу (ѕогі кеуз ЯЕМУ) { 
ѕау $Кеу, "=" $ЕМ/{$Кеу}; 
} 


Можно сортировать значения хеша непосредственно, но это довольно бесполезно 
в отсутствие способа отобразить значения обратно в ключи. Сортировка хеша по 
значениям обычно реализуется как сортировка по ключам, но при этом использу- 
ется функция сравнения, которая обращается к значениям, основываясь на клю- 
чах. Вот пример числовой сортировки хеша в порядке убывания его значений: 


Тогеасп $Кеу (зогф { $һаѕһ{$0} <=> $һаѕһ{$а} } Кеуз Жһаѕһ) { 
ргіпі? ”%49 %$\п”, $һаѕћ{$Кеу}, $кеу; 
} 


Использование Кеуз с хешем, связанным с большим файлом ОВМ, создаст боль- 
шой список, а в результате вы получите прожорливый процесс. Более практично 
в таком случае будет применить функцию еасп, которая обходит все записи хеша. 
не создавая при этом гигантского списка. 


В скалярном контексте Кеуз возвращает число элементов в хеше (и сбрасывает 
итератор еас!). Но чтобы получить эту информацию для связанного хеша, в том 
числе файла ОВМ, Ре! должен обойти весь хеш, что неэффективно. В таком слу- 
чае помогает применение Кеуз в пустом контексте. 


Применение кеуѕ в качестве левостороннего значения увеличит число блоков па- 
мяти, выделенных для данного хеша. (Это похоже на предварительное увеличе- 
ние размера массива путем присваивания большего значения переменной $#аггау.) 
Предварительное расширение хеша может повысить эффективность, если извест- 
но, что хеш будет расти, и нам заранее известно, как сильно. Если сказать: 


кеуѕ %һаѕһ = 1000, 


для %пазН будет выделено не менее 1000 блоков (фактически вы получите 1024 бло- 
ка, так как округление происходит до следующей степени двойки). Сократить ко- 
личество блоков, выделенных для хеша, используя Кеуз указанным способом, 
нельзя (но если — случайно — попытаться сделать это, ничего не произойдет). Бло- 
ки сохраняются, даже если выполнить паз! = (). Обратитесь к ипдеГ %пазй, если 
требуется освободить память, когда %ћаѕћ все еще находится в области видимости. 


См. также еасй, уа1иеѕ и ѕогї. 
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к [авки [8 


К111 $46МАЕ, Е15Т 


Посылает сигнал списку процессов. Значением 51С№А может быть целое число или 
имя сигнала в кавычках (без приставки “516"). Попытка указать неизвестное имя 
сигнала вызовет исключение. Функция возвращает число процессов, которым ус- 
пешно передан сигнал. Если 51СМ! является отрицательным числом, функция пе- 
редаст сигнал не отдельному процессу, а группе. (В системах ОМІХ, производных 
от 5у5У, отрицательный номер процесса так же вызывает передачу сигнала груп- 
пе процессов, но такой способ не переносим.) Если РШ равен нулю, посылается 
сигнал всем процессам с таким же идентификатором группы, как у отправителя. 
Например: 


$спЕ = Кі11 1, $61191, $сһ21142; 
кі11 9, @допегз; 
К111 “5ТОР”, детрріа # Можно *такх приостановить свой интерпретатор команд 
# по умолчанию 
ип]е$$ деїррій == 1; # (Но не дразните іпії(8).) 


Сигнал 5ТСМЕ, равный 0, проверяет, жив ли процесс и достаточно ли у вас приви- 
легий, чтобы послать ему сигнал. Сигнал при этом не посылается. Таким спосо- 
бом можно удостовериться, что процесс еще существует и не сменил свой ОТО. 


изе Еггпо ом(ЕЗВСН ЕРЕВМ); 
Р (Кі11 0 => $тіпіоп) { 
ѕау "Фпіпіоп жив! "; 
} е151Ғ ($! == ЕРЕВМ) { # изменил ПТО 
зау “фтап1оп вышел из-под контроля!”; 
} е1заР ($! == ЕЗАСН) { 
зау "Фтіпіоп скончался ”, # или стал зомби 
} е1зе { 
магп “Странно, не удалось проверить состояние $тіп1оп: $!\п” 


} 


См. раздел «Сигналы» главы 15. 


1[а$1 |59, 


1аѕі [АВЕЕ 
Іаѕї 


Оператор 1а5ї осуществляет немедленный выход из данного цикла, как инструк- 
ция бгеакв С или Јауа (при использовании в циклах). Если метка [АВЕ отсутствует, 
оператор относится к самому внутреннему охватывающему циклу. Блок соп1лие, 
если он есть, не выполняется. 


МЕ: мћі1е (<МАТЕМ56>) { 
1аѕі МЕ ЇР /7$/; # выйти после конца заголовка 
# здесь оставшаяся часть цикла 


} 


1а8ї нельзя применять для выхода из блока, возвращающего значение, например, 
еуа1 {}, ѕир {} или до {}, не должен он использоваться и для выхода из операции 
дгер или пар. Если включен вывод предупреждений, Ре! сообщит о применении 
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1а5ї для выхода из цикла, который находится вне текущей лексической области 
видимости, например, из цикла вызывающей подпрограммы. 


Собственно блок семантически идентичен циклу, выполняемому один раз. Поэто- 
му 1аѕї можно использовать для досрочного выхода из такого блока. В главе 4 
приведены примеры, демонстрирующие работу 1а5ї, пехї, гедо и сопїіпие. 


‹ ЕП 


1с ЕХРВ 
1с 


Возвращает версию ЕХРА, в которой все символы приведены к нижнему регистру. 
Это – внутренняя функция, реализующая еѕсаре-последовательность \| в стро- 
ках, заключенных в двойные кавычки. 


Не используйте 1с для реализации сравнения без учета регистра символов, как, 
возможно, вы делали при работе со строками АЗСП, потому что для строк Юни- 
кода этот прием дает неверные результаты. В последнем случае лучше использо- 
вать функцию їс (выполняющую свертку регистра) из модуля /пісойе: :СаѕеҒо]1а 
в СРАМ или задействовать прагму изе Геафиге “Рс” (в Ре версии у5.16 или более 
поздней). Дополнительные сведения можно найти в разделе «Ошибочные пред- 
ставления о регистре» главы 6. 


Функция 1с игнорирует коды в диапазоне 128-256, если к строке не применяется 
семантика Юникода (и не действует режим национальных настроек), о чем труд- 
но догадаться. Особенность ип1с00е_51г119$ гарантирует включение семантики 
Юникода даже для этих кодов. См. главу 6. 


Текущее значение |С_СТУРЕ учитывается, если действует изе 10са1е, хотя взаимо- 
действие национальных настроек с Юникодом является, как говоричся, предме- 
том текущих исследований. Последние результаты можно найти на страницах. 
руководства регЦосще (ћ11р://регійос.регі.оге/регИосаіе.ћіт!), регіипісоӣе (ћ1р:// 
регійос.регі.огв[регіипісоӣе.ћіті) и регіѓипс (ћ1р://регійос.регі.оге/регіїипс.Мті). 


ІсЕїгѕї [517] 


1сҒігѕї ЕХРВ 
1СҒігѕЇ 


Возвращает вариант строки ЕХРВ с первым символом в нижнем регистре. Это — 
внутренняя функция, реализующая езсаре-последовательность \1 в строках, за- 
ключенных в двойные кавычки. См. предыдущую статью (1с), где приводятся до- 
полнительные предупреждения, касающиеся регистра символов в Юникоде. 


Іепаїћ ра 


1епдїһ ЕХРВ 
16п9їћ 


Возвращает длину скалярной величины ЕХРА в кодах (символах, видимых про- 
граммисту). При вызове без аргумента возвращает длину $ . (Однако смотрите, 
чтобы дальнейший код сценария не выглядел как начало ЕХРА, иначе лексиче- 
ский анализатор Рег] собьется. Например, 1епоїћ < 10 не будет компилироваться. 
Если сомневаетесь, используйте круглые скобки.) 
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Не пытайтесь применять 1епдїћ для определения размера массива или хеша. Для 
массива следует использовать ѕса1аг баггау, а для хеша — ѕса1аг Кеуз Фпазн. (вызов 
ѕса1аг обычно опускается, если является избыточным.) 


Чтобы найти длину строки в графемах (символах. видимых пользователю), их 
можно просто подсчитать: 


пу $соипЕ = 0; 
фсоипїі++ мһі1е оиг $$1г1п9 =- /\Х/9; 


или воспользоваться модулем Ип1соде: :6С5$1г1п9 из СРАМ, позволяющим работать 
со строками, как с последовательностями графем, а не кодов. Этот модуль позво- 
ляет также определить длину строки в позициях вывода. При таком подходе со- 
храняется возможность использовать рг1п{{ для форматирования вывода, а если 
включить творческую жилку, вы сможете даже использовать їогпаї и мгіїе, не- 
смотря на то, что код при выводе может занимать одну или две позиции или вооб- 
ще не занимать позиций. 


__ ИМЕ __ 


Специальная лексема, компилирующаяся в номер текущей строки. См. раздел 
«Генерирование Рей в других языках» в главе 21. 


пк Ге |х. а 
11пк ОШЕПЕ, МЕМЕПЕ 


Создает новое имя файла, являющееся ссылкой на старое имя файла. Возвраща- 
ет истинное значение в случае успеха и ложное в противном случае. См. также 
ѕутіпк далее в этой главе. Вероятно, что эта функция окажется реализованной 
только в ОМГХ-системах. 


А «ХЕХ, 
І 
їѕеп 191 две, 0. 
1іѕїеп 50СКЕТ, ОЦЕЦЕЗТРЕ 
Предписывает системе принимать подключения через сокет 50СКЕТ и помещать 
запросы на подключение, ожидающие обработки, в очередь размером 00ЕЏЕ51/Е. 
Представьте себе, что на телефоне есть очередь ожидающих вызовов, в которую 


могут встать до 17 позвонивших. (Мурашки по коже!) Функция возвращает ис- 
тинное значение в случае успеха и ложное в противном случае. 


иѕе Зоскет; 
1ізіеп(РВОТОЅОСК, УОМАХСОММ) 
|| діе “невозможно установить очередь ожидания на РВОТОЅОСК: $!" 


См. описание функции ассерї. См. также раздел «Сокеты» главы 15 и описание 
иѕіеп(2). 
Іосаі 

10са1 ЕХРА 


Этот оператор не создает локальную переменную, для этой цели применяется пу. 
Вместо этого он локализует существующие переменные, т.е. в результате одна 
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или более переменных получают значения с локальной областью видимости в са- 
мом внутреннем охватывающем блоке, е\уа1 или файле. Если перечислено несколь- 
ко переменных, список следует заключить в круглые скобки, поскольку этот опе- 
ратор связывает сильнее, чем запятые. Все переменные должны быть разрешен- 
ными левосторонними конструкциями, т.е. допускать присваивание значений. 
В их число могут входить отдельные элементы массивов и хешей. 


При выполнении этого оператора текущие значения указанных переменных со- 
храняются в скрытом стеке и восстанавливаются после выхода из блока, подпро- 
граммы, е\уа1 или файла. После выполнения 10са1, но перед выходом из области 
видимости, все подпрограммы и выполняемые форматы будут видете локальное 
(внутреннее) значение, а не предыдущее (внешнее), поскольку переменная остает- 
ся глобальной, несмотря на наличие у нее локального значения. На техническом 
языке это называется динамической областью вибимости. См. раздел «Объявле- 
ния с областью видимости» главы 4. 


Выражению ЕХРА можно при желании присваивать значение, что позволяет ини- 
циализировать переменные при их локализации. В отсутствие инициализатора 
все переменные получают значение ипіе?, а все массивы и хеши — значение (). Как 
и при обычном присваивании, если переменные заключены в круглые скобки 
(или если переменная является массивом или хешем), выражение справа вычис- 
ляется в списочном контексте. В противном случае выражение справа вычисля- 
ется в скалярном контексте. 


В любом случае выражение справа вычисляется перед локализацией, но инициа- 
лизация происходит после локализации, поэтому локализованную переменную 
можно инициализировать ее нелокализованным значением. К, примеру, следую- 
щий код показывает, как выполнить временную модификапию глобального мас- 
сива: 


іҒ ($5м ед `-м") { 
# инициализировать локальный массив глобальным 
1оса1 @АВСУ = @АВСУ; 
ип РЕ(@АВСУ, "есһо”); 
Ѕуѕтет @АВСУ; 
} 


# @ААСУ восстановлен 
Можно также временно модифицировать глобальные хеши: 


# временно добавить пару записей к хешу %91911$ 

1 ($6азе12) { 
# (ЗАМЕЧАНИЕ: Мы не утверждаем, что это эффективно!) 
10са1(%919113) = (%0101ї5, Т => 10, Е => 11); 
рагзе_пит(); 


} 


Посредством 10саї можно присвоить временные значения отдельным элементам 
массивов и хешей, даже имеющим лексическую область видимости: 


11 (Фргокестей) { 

1оса1 $510{ІМТ} = “ТОМ№НЕ”; 

ргесіоиѕ(); # никаких прерываний во время выполнения этой функции 
} # предыдущий обработчик (если он был) восстановлен 
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Можно также использовать 10са1 с переменными типа %$уре?10Ъ для создания ло- 
кальных дескрипторов файлов без загрузки обьемистых модулей объектов: 


1оса1 +*МОТО; # защита глобальных дескрипторов МОТО 
пу ФЕН = до { 1оса1 *ЕН }; # создать новый косвенный дескриптор 


В старом коде еще можно увидеть локализованные переменные $уре?]оЪ, необхо- 
димые для создания новых дескрипторов файлов, однако в настоящее время дос- 
таточно простого пу $#ћ, поскольку, если передать в качестве аргумента неопреде- 
ленную переменную туда, где ожидается реальный дескриптор файла (например, 
в первом аргументе функции ореп или зоске{) Ре «автоматически оживить для 
вас новенький дескриптор файла. 


В общем случае следует использовать пу, поскольку 10са1 означает совсем не то, 
что большинство понимает как «локальный». См. описание пу. 


Для локального удаления элементов хеша или массива, т.е. для удаления в теку- 
щем блоке, можно использовать конструкцию де1е{е 1оса1 ЕХРА. 


Іосаііте 


1оса1 {1те ЕХРА 
]1оса1{1те 


Преобразует значение, возвращаемое їл1пе, в список из девяти элементов, пред- 
ставляющих время, приведенное к местному часовому поясу. Обычно она исполь- 
зуется так: 


#0 1 2 3 4 5 6 7 8 
($зес, %тіп, Фпоиг, $тдау, Фпоп, Фуеаг, $идау, $удау, $15051) = 1оса1Тіле; 


Если, как в данном случае, аргумент ЕХРА опущен, выполняется 10са11те(+1те()). 


Все элементы списка представляют собой числа и поступают прямо из ѕїігисї їп. 
(Это жаргон прогрыммирования на С – пусть он вас не беспокоит.) В частности, это 
означает, что $поп имеет диапазон 0. .11, и январю соответствует число 0, а $мдау 
имеет диапазон 0..6, и воскресенье обозначается числом 0. Несложно запомнить, 
какие величины имеют нумерацию с нуля, поскольку именно они всегда служат 
индексами массивов, содержащих названия месяцев и дней недели и также имею- 
щих нумерацию с нуля. 


Например, получить название текущего дня недели можно так: 
$півдау = (“Зип”, “Моп”, "Тие", “мед”, "Тһи”, "Ег1 ', "ба" ) (1оса1+1те)[61]; 


$уваг — количество лет, прошедших после 1900; т.е. в 2023 году $уеаг будет иметь 
значение 123, а не просто 23. Чтобы получить четырехзначный год, просто скажи- 
те $уеаг + 1900. Чтобы получить двузначный год (например, «01» в 2001 году), ис- 
пользуйте ѕргіпі?(”%020", $уеаг % 100). 


Модуль библиотеки Рег] Тіпе::Іосг1 содержит подпрограмму їіпе10са1, осуществ- 
ляющую преобразование в обратном направлении. 


В скалярном контексте 10осаіѓіпе возвращает строку в стиле сНте(3). Например, 
команду 0411) можно (почти полностью)! эмулировать с помощью: 


1 Яаіе(1) выводит часовой пояс, а 10са1їіпе - нет. 
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рег1 -1е 'ргіпі эса1аг 1оса1+іте()` 


См. также описание функции ѕігѓїііте в стандартном модуле РОЗ1Х; она реализует 
более развитые возможности форматирования времени. Модуль Т1те::10са1+1те 
поддерживает интерфейс к этой функции через имена. 


ІосКк 
1оск ТНІМС 


Устанавливает блокировку на переменную, подпрограмму или объект, на кото- 
рый ссылается ТИС, пока блокировка не выйдет из области видимости. Для об- 
ратной совместимости эта функция реализуется как встроенная, но только если 
версия Ре! скомпилирована с поддержкой потоков выполнения и только в облас- 
ти действия прагмы изе Тһгеадѕ. В противном случае Ре! воспринимает ее как 
функцию, определенную пользователем. 


109 ра $@ 


109 ЕХРВ 
109 


Возвращает натуральный логарифм (т.е. по основанию е) ЕХРЯ. Для отрицатель- 
ных значений ЕХРЯ возбуждается исключение. Чтобы получить логарифм по дру- 
гому основанию, используйте элементарную алгебру: логарифм числа по основа- 
нию М равен натуральному логарифму этого числа, деленному на натуральный 
логарифм №. Например: 


ѕир 10910 { 

пу $п = 5П1ЁТ; 

гефигп 109($п) /109(10); 
} 


Обратной для 109 функцией является ехр. См. ехр. 


[аї АСТЕ 


151їаї ЕХРВ 
15їаї 


Действует подобно функции ѕїаї (включая установку специального дескриптора 
файла _), но если файл является символической ссылкой, выполняется ѕіаї для 
собственно символической ссылки, а не для файла, на который она указывает. 
(Если символические ссылки не реализованы в системе, выполняется обычный 
вызов ѕіаї.) 


т// 


/РАТТЕАМ/ 
П/РАТТЕНМ/ 


р 


Выполняет поиск по шаблону, где РАГТЕЯМ служит регулярным выражением. 
В программе этот оператор интерпретируется как строка в двойных кавычках, 
а не функция. См. главу 5. 
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тар 


пар ВЕОСК ЕТ5Т 
пар ЕХРА. ІІТ 


Вычисляет ВЕОСК или ЕХРЕ для каждого элемента списка / 157 (поочередно присваи- 
вая локализованной переменной $_ значение каждого элемента) и возвращает 
список, объединяющий результаты всех вычислений. Блок ВЕОСК или выражение 
ЕХРЯ вычисляется в списочном контексте, поэтому каждый элемент / 157 может 
отображаться в ноль, в один или несколько элементов возвращаемого значения. 
Все они помещаются в один в один плоский список. Например: 


@могаѕ = тар { зрТ } @1іпеѕ; 


нревратит список строк в список слов. Но часто существует взаимно однозначное 
соответствие между исходными и конечными значениями: 


@сһагѕ = тар сһг, @пит$; 


превратит список чисел в список соответствующих символов. А вот пример ото- 
бражения один к двум: 


%пазН = мар { депкеу($_) => $_ } @аггау; 
что является лишь необычным вариантом следующей конструкции: 


Упазй = (); 

Гог ту $_ (@аггау) { 
$НазН{депкеу($_)} = $_; 

} 


Поскольку $_ является псевдонимом (неявной ссылкой) значения списка, эту пе- 
ременную можно использовать для изменения элементов массива. Это удобно 
и поддерживается, хотя может порождать странные результаты, когда [157 не яв- 
ляется именованным массивом. Применение для этих целей обычного цикла 
Тогеасһ может оказаться более прозрачным. См. также дгер. Функция пар отлича- 
ется от дгер тем, что возвращает список результатов всех последовательных вы- 
числений ЕХРЕ, тогда как дгер возвращает список всех значений / 157, для которых 
ЕХРА имеет истинное значение. 


Е | УХ] 
ткаіг $ І ТА 
пКа1г АТГ ЕМАМЕ, МАЅК 
ткаіг ЕТЕЕМАМЕ 


Создает каталог с именем РП ЕМАМЕ и правами доступа, определяемыми числовой 
маской МАЅК с учетом текущего значения ипаѕк. В случае успеха возвращает истин- 
ное значение, в противном случае – ложное. 


Если аргумент МА5К опущен, используется маска 0777, что почти всегда соответст- 
вует желаемому значению. В целом предпочтительнее создавать каталоги с мас- 
кой МАЅК, дающей более широкие полномочия (например, 0777), и позволять поль- 
зователю модифицировать ее с помощью собственного значения ипазк, чем зада- 
вать ограничивающую маску, отбирая у пользователя возможность сужать эти 
полномочия. Исключение составляют каталоги и файлы, которые должны быть 
закрытыми (например, почтовые файлы). См. ипаѕк. 
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Если системный вызов тЁай"(2) не встроен в библиотеку С, Рей эмулирует его, 
вызывая программу тЁай(1) для каждого каталога. При необходимости созда- 
ния большого списока каталогов в такой системе эффективнее вручную вызвать 
программу тКаг со списком каталогов, чем запускать тьму подпроцессов. 


п159с4 Е Г] 
пз0с1 Д0, СМР, АВС 


Выполняет системный вызов Ѕуѕќет У ІРС тѕ6с1(2); подробности см. в тзѕасі(2). 
Может потребоваться сначала выполнить изе ТРС::5у$\, чтобы получить определе- 
ния констант. Если в СИ передается значение ІРС_5ТАТ, то в ААС должна передаваться 
переменная, куда будет помещаться возвращаемая структура С пѕдій 05. Возвра- 
щаемые значения – такие же, как в іосї1 и ѓспї1: ипде! означает ошибку, "0 Бит {гие` 
означает ноль, и фактическое возвращаемое значение в остальных случаях. 


1$9С11 доступна только в системах, поддерживающих механизмы Бузфет У ІРС, 
а таких значительно меньше, чем поддерживающих сокеты. 


тсѕддеї Я 0. 
тѕодеї КЕУ, АГА05 
Выполняет системный вызов Бузфет У ІРС тѕа6е{(2). Подробности см. в тѕ20е1(2). 


Возвращает идентификатор очереди сообщений или ипіеї в случае ошибки. Пе- 
ред вызовом необходимо выполнить изе ТРС::5у$\. 


Доступна только в системах. поддерживающих механизмы Зузёет У ТРС. 


Т59ГСУ | 5! | 0. 
п$огсу 10. МАЙ. 512Е, ТҮРЕ. РІАб5 

Выполняет системный вызов тз8гсо(2), чтобы извлечь сообщение иг: очереди 
сообщений 1) в переменную "АВ, ограничив размер сообщения значением 5//Е, 
Подробности см. в тзёгси(2). После получения сообщения в начале УАВ будет на- 
ходиться тип сообщения, а максимальная длина УАВ вычисляется как $17Е плюс 
размер типа сообщения. Декодировать содержимое переменной можно вызовом 
ипраск(”1! ах“). Функция возвращает истинное значение в случае успеха и лож- 
ное, если возникла ошибка. Перед вызовом необходимо выполнить изе ТРС::5уз\. 


Доступна только в системах, поддерживающих механизмы Зуз4ет У ІРС. 


ге 
тѕоѕпа ЕЛЕ 
тѕдѕпо Ір, М0, РІАб5 


Выполняет системный вызов т868%п0(2) для отправки сообщения №56 в очередь со- 
общений 1р0. Подробности см. в т1555п0(2). Аргумент М6 должен начинаться с длин- 
ного целого, представляющего тип сообщения. Создать сообщение можно так: 


$т59 = раск "1! а*”, $#уре, $1ехї оѓ пеѕѕаде; 


Возвращает истинное значение в случае успеха и ложное, если возникла ошибка. 
Перед вызовом необходимо выполнить изе ІРС::5у$\. 


Доступна только в системах, поддерживающих механизмы Бузфет У ІРС. 
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ту 
ту ТҮРЕ ЕХРВ : АТТЕУВОТЕ$ 
ту ЕХРА АТТЕІВШТЕЅ 


ту ТҮРЕ ЕХРЯ 
ту ЕХРА 


Этот оператор объявляет одну или более закрытых переменных, которые будут 
существовать только в самом внутреннем охватывающем блоке, подпрограмме, 
еуа1 или файле. Если перечислено несколько переменных, список необходимо за- 
ключить в круглые скобки, поскольку этот оператор связывает сильнее, чем за- 
пятые. Объявлять таким способом можно только простые скаляры или целые 
массивы и хеши. 


Имя переменной не может квалифицироваться именем пакета, поскольку все пе- 
ременные пакета глобально доступны через соответствующие им таблицы симво- 
лов, а лексические переменные не связаны с какими-либо таблицами символов. 
Поэтому, в отличие от 10са1, этот оператор не имеет к глобальным переменным 
никакого отношения, за исключением того, что маскирует все переменные с та- 
кими же именами в своей области видимости (т.е. там, где существуют закрытые 
переменные). Однако доступ к глобальной переменной всегда можно получить, 
квалифицировав ее именем пакета, или через символическую ссылку. 


Область видимости закрытой переменной начинается лишь командой, находя- 
щейся после объявления такой переменной. Область видимости переменной про- 
стирается на все последующие вложенные блоки, вплоть до конца области види- 
мости самой переменной. 


Однако это означает, что любые подпрограммы, которые вызываются из области 
видимости закрытой переменной, не могут видеть эту закрытую переменную, ес- 
ли только блок с определением подпрограммы не вложен текстуально в область 
видимости этой переменной. Это звучит сложно, пока вы с этим не разберетесь. 
На техническом языке это называется лексической областью видимости (езде 
всоріп&), поэтому такие переменные мы часто называем лексическими. В культу- 
ре С их часто называют «автоматическими» переменными, поскольку они авто- 
матически создаются и удаляются при входе и выходе из области видимости. 


Выражению ЕХРА можно при желании присваивать значение, что позволяет ини- 
циализировать лексические переменные. (Если инициализатор отсутствует, все 
скаляры получают неопределенное значение, а все массивы и хеши — пустой спи- 
сок). Как и при обычном присваивании, если переменные слева заключаются 
в круглые скобки (или если переменная является массивом или хешем), выраже- 
ние справа вычисляется в списочном контексте. В противном случае выражение 
справа вычисляется в скалярном контексте. Например, формальным парамет- 
рам подпрограммы можно дать имена с помощью списочного присваивания: 


му ($Рг1епдз. $готапѕ, $соипгутеп) = @ ; 


Следите за тем, чтобы не забыть о скобках, указывающих на списочный контекст 
присваивания, например: 


ту $соипїгу = @_; # правильно или нет? 


Здесь переменной присваивается длина массива (т.е. число аргументов подпро- 
граммы), поскольку массив вычисляется в скалярном контексте. Однако скаляр- 
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ное присваивание формальному параметру возможно посредством оператора 5111. 
На практике, поскольку методам объектов в первом аргументе передается объект, 
многие подпрограммы методов начинают с того, что «крадут» первый аргумент: 


ѕиб ѕітр1е аз { 
пу $ѕе1# = зһіғ+; # присваивание скаляра 
ту ($а, $0, $с) = @ ; # присваивание списка 


} 


Если попытаться объявить подпрограмму с лексической областью видимости 
как пу зи6, Рей завершит работу сообщением, что эта функция пока не реализо- 
вана. (И, конечно, Регі не завершится, если эта функция уже реализована.1) 


Параметры ТУРЕ и АТТЕТВИТЕ$ являются необязательными. Вот как выглядит объ- 
явление с использованием этих параметров: 


ту 009 $$роф :еагѕ(ѕһогі) :їаі1(109); 


ТУРЕ, если задан, определяет тип скаляра или скаляров, объявленных в ЕХРВ, либо 
непосредственно, как одна или более скалярных переменных, либо косвенно, че- 
рез массив или хеш. Если ТҮРЕ является именем класса, предполагается, что ска- 
ляры содержат ссылки на объекты этого типа или объекты, совместимые с этим 
типом. В частности, совместимыми считаются производные классы. Следова- 
тельно, если предположить, что С0111іе происходит от 009, можно объявить: 


ту 009 $1а$$1е = пем С0111е; 


Данное объявление сообщает, что объект $1а5516 будет использоваться подобно 
объекту 009. То обстоятельство, что фактически это объект (С0111е, не должно 
иметь значения до тех пор, пока с ним делают то, что можно делать с 009. Благо- 
даря магии виртуальных методов, в классе С011іе вполне может присутствовать 
собственная реализация этих методов 000, но объявление выше говорит только об 
интерфейсе, а не о реализации. Теоретически. 


В действительности, на сегодняшний день Ре! не придает большого значения ин- 
формации о типе, но она доступна для усовершенствований в будущем. (Традици- 
онно эта информация использовалась в псевдохешах, но они уже сошли со сцены.) 
Объявление ТУРЕ следует рассматривать как родовой интерфейс, который когда- 
нибудь будет реализовываться различными способами в зависимости от класса. 
На самом деле, ТУРЕ может даже не являться официальным именем класса. Мы 
зарезервировали имена типов в нижнем регистре для Регі, потому что один из 
способов, которыми мы хотели бы расширить интерфейс типа, состоит в разреше- 
нии необязательных объявлений типов низкого уровня, таких как іпі, пип и $(г.2 
Эти объявления не будут использоваться для контроля типов; они будут служить 
советами компилятору в отношении того, как оптимизировать хранение перемен- 
ной, предполагая, что переменная по преимуществу будет использоваться так, 


і Наэто есть определенные надежды, так как опыт разработки Рег! 6 демонстрирует, что 
подпрограммы могут быть по умолчанию лексическими, и при этом использовать их 
будет так же просто. 


* Фактически именно такой синтаксис поддержки встроенных типов в настоящее время 
исследуется в Рег! 6, поэтому парни из Рег! 5 смогут позаимствовать все самое лучшее, 
когда парни из Регі 6 решат все проблемы. :—) 
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как объявлена. Семантика скаляров останется, в основном, той же - по-прежне- 
му можно будет складывать два скаляра $31г или выводить скаляр 111, как если 
бы они были обычными полиморфными скалярами, с которыми вы уже знако- 
мы. Но для переменной, объявленной как 111, Ре] мог бы хранить только целое 
значение и забыть о кэшировании конечной строки, которое выполняется сейчас. 
Ускорились бы циклы с управляющей переменной типа іпї, особенно в коде, 
скомпилированном в С. В частности, числовые массивы можно было бы хранить 
гораздо более компактным способом. В конечном итоге, встроенная функция мес 
может выйти из употребления, если мы разрешим писать такие объявления: 


пу рії ©6151 пд; 


Объявление АТТАТВОТЕ$ используется чаще, чем определения типов; подробнее об 
этом читайте в описании прагмы аїїгіриїеѕ в главе 29. Первым атрибутом, кото- 
рый мы когда-нибудь реализуем, будет, вероятно, сопѕїапї: 


ту пип $РТ . сопзфапЕ = афап2(1,1) * 4: 


Но есть и другие идеи, такие как определение значений по умолчанию для масси- 
вов и хешей или разрешение совместного использования переменных нескольки- 
ми взаимодействующими интерпретаторами. Подобно интерфейсу типа, интер- 
фейс атрибутов должен рассматриваться как родовой интерфейс, своеобразное 
рабочее место для изобретения нового синтаксиса и семантики. Мы не знаем, как 
будет развиваться Регі в следующие десять лет. Мы знаем только, что можем об- 
легчить себе жизнь. планируя заранее это развитие. 


См. также 10са1, оџг и раздел «Объявления с областью видимости» главы 4. 


пем 


пем СЕАЗЗМАМЕ 1 ТЅТ 
пем СЕАЗЗМАМЕ 


В Рен отсутствует встроенная функция пем. Это просто обычный метод-конструк- 
тор (т.е. подпрограмма, определяемая пользователем), которая определяется или 
наследуется классом (1 А55М№АМЕ (т.е. пакетом), чтобы дать возможность создавать 
объекты типа (1 А55М№МЕ. Многие конструкторы именуются «пем», но лишь по дого- 
воренности, призванной обмануть программистов на С++, чтобы им казалось, что 
они понимают происходящее. Всегда читайте документацию класса, чтобы уз- 
нать, как вызывать его конструкторы; например, конструктор, создающий ТК-вид- 
жет списка, называется просто 1 іѕїрох. См. главу 12. 


пехї ва] 


пехЕ Г[АВЕЕ 
пехї 


Оператор пехї действует подобно команде сопїіпие в языке С: он начинает очеред- 
ную итерацию цикла, обозначенного меткой / АВЕ: 


ІШІМЕ: мт11е (<5ТрІМ) { 
пехї ІІМЕ 1 /7#/; # пропустить комментарии 
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Если бы в этом примере присутствовал блок сопїіпое, он был бы выполнен сразу 
после вызова пехїі. Если метка [ АВЕ! опущена, оператор ссылается на самый внут- 
ренний охватывающий цикл. 


Собственно блок семантически идентичен циклу, выполняемому один раз. Поэто- 
му пехї осуществляет досрочный выход из такого блока (через блок соп1пие, если 
он есть). 


Нельзя организовывать при помощи пехт выход из блока, который возвращает 
значение, например е\а1 {}, зи6 {} или йо {}, кроме того, этот оператор не должен 
применяться для выхода из операции огер или пар. Если включен вывод преду- 
преждений, Рег! сообщит, когда пехї используется для выхода из цикла, который 
находится вне текущей лексической области видимости, например, цикла в вы- 
зывающей подпрограмме. См. раздел «Операторы циклов» в главе 4. 


по ве 


по МОРИГЕ УЕВЗТОМ 1 ІЅТ 
по МОДЕ УЕВУТОМ 

по МОБИЕЕ Е15Т 

по МОРИ Е 

по УЕЯУТОМ 


Ознакомьтесь с описанием оператора изе, который представляет собой своего ро- 
да противоположность по. Большинство стандартных модулей не осуществляет 
обратного импорта чего-либо, что, в сущности, делает по пустой операцией. Моду- 
ли прагм склонны быть здесь более любезными. Если МОБШЕ не удается найти, 
возникает исключение. 


осі Еа 


осї ЕХРЕ 
осї 


Интерпретирует ЕХРА как восьмеричную строку и возвращает эквивалентное де- 
сятичное значение. Если строка ЕХРЯ начинается с "Ох", она интерпретируется как 
шестнадцатеричное число, а если с "06 – как двоичное. Следующий код правиль 

но преобразует любые строковые представления чисел в десятичной, двоичной, 
восьмеричной и шестнадцатеричной форме записи, стандартной для Регі, в соот- 
ветствующие целые числа: 


$\а1 = ост $уа1 1? $ма1 =- /70/; 
Обратное преобразование можно выполнить посредством $зргапт, используя под- 
ходящий формат: 

$Чес_регтз = (ѕћа("ҒРіЛепате”)) [2] & 07777; 

фосї регт_ѕЁг = ѕргіпі? "%о”, $дес_регтз; 


Функция осї обычно используется, когда необходимо преобразовать строку дан- 
ных, такую как "644", например, в маску прав доступа к файлу. Хотя Рег] автома- 
тически преобразует строки в числа по мере надобности, такое автоматическое 
преобразование предполагает использование основания 10. 


Ведущие пробелы и любые нецифровые символы в конце, такие как десятичная 
точка, игнорируются без вывода каких-либо предупреждений (ост обрабатывает 
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только неотрицательные целые числа и не может обрабатывать отрицательные 
числа или числа с плавающей запятой). 


т х І 
ореп Е АВС ТЦ | 
ореп ЕЛЕЕНАМОЕЕ, МОРЕ, ЕХРВ, Е1$Т 
ореп ЕТІ ЕНАМІ Е, МОРЕ. ЕХРВ 
ореп АІ ЕНАМІЕ, МОРЕ, ВЕРЕВЕМСЕ 
ореп ЕТЁЕЕНАМОЕЕ, ЕХРВ 


Функция ореп связывает внутренний дескриптор файла РП ЕНАМІЕ со специфика- 
цией внешнего файла, определяемой аргументами ЕХРА или [15Т. Эту функцию 
можно вызывать с одним, двумя или тремя аргументами (или более, если третий 
аргумент является командой). Если аргументов три или более аргументов, второй 
аргумент МОбЕ указывает режим доступа, в котором должен быть открыт файл, 
а третий аргумент — фактическое имя файла или выполняемую команду, в за- 
висимости от режима. Вместе с командой можно передать дополнительные аргу- 
менты, если потребуется вызвать команду, например, ѕузїеп или ехес, непосред- 
ственно, без вовлечения интерпретатора команд. Команду можно также передать 
единым аргументом (третьим), и в таком случае решение о вызове командного 
интерпретатора зависит от наличия в этом аргументе метасимволов. (Не исполь- 
зуйте более трех аргументов, если аргументы представляют собой обычные име- 
на файлов: это не сработает.) Если режим МОЕ не распознан, ореп возбуждает ис- 
ключение. 


Особый случай представляет версия с тремя аргументами, определяющая режим 
для чтения/записи, когда в третьем аргументе передается ипдет: 


ореп(шу $тр, ”+>”. ипде?) ог 91е .. 


Этот вызов откроет дескриптор файла для безымянного временного файла. До- 
пускается также симметричный режим `+<, но, прежде чем что-то прочесть из 
временного файла, это «что-то» нужно сначала записать в него. Перед чтением 
придется воспользоваться функцией ѕеек. 


Версию ореп с тремя аргументами можно использовать, чтобы включить фильтры 
ввода/вывода (иногда они называются «дисциплинами»), реализующие проме- 
жуточную обработку входных и выходных данных (см. описание модуля Рег110). 
Например: 
ореп(ту ФРһ, “< :епсод1па(ИТЕ-8)” "ҒіІепапе”) 
|| @1е "сап'і ореп УТЕ-В епсодед Ғі1епапе: $! ": 

откроет файл в кодировке ОТЕ-8 (т.е. файл, содержащий символы Юникода). На- 
чиная с версии У5.14, в случае ошибки декодирования входных потоков в кодиров- 


ке ОТЕ-8, исключение не возбуждается. Если вы используете какой-либо фильтр 
поддержки ОТЕ-8, рассмотрите возможность добавления директивы: 


иѕе магпіпоѕ РАТАЕ => "178"; 


чтобы иметь возможность перехватывать исключения. См. главу 6. 


Обратите внимание, что при использовании фильтров в ореп с тремя аргумента- 
ми, фильтры по умолчанию, хранящиеся в ${^ОРЕМ}, игнорируются. (См. главу 25; 
фильтры по умолчанию устанавливаются прагмой ореп или ключом -Сіор.) 
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Если ваша версия Рег] была собрана с использованием Рег110!, дескрипторы фай- 
лов можно открывать непосредственно в скаляры Ре! |, передавая ссылки на эти 
скаляры в аргументе ЕХРА вызова ореп с тремя аргументами: 


ореп($%#һ, >”, \фуагіар1е) ||.. 


Чтобы повторно открыть дескриптор файла 5Т000Т или ЭТОЕВЯ для вывода в файл, 
хранящийся в памяти, дескриптор сначала нужно закрыть: 


с10ѕе($Т000Т) || діе "Невозможно закрыть ЗТООИТ: $! ", 
ореп($Т000Т, "> \$уагіаб1е) || діе "Невозможно открыть ЗТООИТ в памяти’ $! “; 


Если аргументов только два, предполагается, что режим и имя файла/команда 
объединены во втором аргументе. (Если во втором аргументе указать только имя 
файла, по соображениям безопасности файл будет открыт только для чтения.) 


ореп(106, “> 109 е”) ог 91е “Невозможно создать 109 11е: $! "; # хорошо 
ореп(106. “>”, “109 1е"”) ог 91е “Невозможно создать 109ѓі1е. $! “; # еще лучше 


Функция ореп возвращает истинное значение в случае успеха и ипіеѓ - в против- 
ном случае. Если ореп открывает канал в дочерний процесс, она вернет идентифи- 
катор этого процесса. Как и для любого системного вызова, всегда проверяйте 
значение, возвращаемое ореп, чтобы убедиться в успехе операции?. Но это не С или 
Јауа, поэтому избегайте команды 11, если можно ограничиться оператором ||. До- 
пускается также использовать ог, и в этом случае можно опустить ( ) в вызове ореп. 
Если вы решили опустить скобки и превратить функцию в оператор списка, сле- 
дите, чтобы за списком следовала конструкция ог 01е, а не || Піе, потому что при- 
оритет || выше, чем у списочных операторов, и || будет относиться к последнему 
аргументу, а не к результату ореп в целом: 


ореп 106, ">", "10одғі1е” || 91е "Невозможно создать 109111е: $1”; # НЕВЕРНО 
ореп 106, ">", "109 1е” ог іе "Невозможно создать 109111е $!7; # ок 


В такой форме записи трудно разобраться, поэтому, чтобы было видно, где закан- 
чивается оператор списка, обычно вводят скобки: 


ореп(06, “>”, "109ғі1е”) ог діе “Невозможно создать 109111е: $!° # хорошо 
ореп(106, ">", "1ІодҒі1е") || діе "Невозможно создать 109#і1е: $!` # хорошо 


или просто переносят ог на другую строку: 


ореп 106, ">", "10дғі1е" 
ог діе “Невозможно создать 109111е $!”: 


Как видно из примера, аргумент ЕГ(ЕНАМОЕЕ часто является простым идентифика- 
тором (обычно в верхнем регистре), но может также быть выражением, возвра- 
щающим ссылку на дескриптор файла. (Это может быть символическая ссылка на 
имя дескриптора файла или жесткая ссылка на любой объект, который может ин- 
терпретироваться как дескриптор файла.) Это называется косвенным дескрипто: 
ром файла (іпаігесі Шећапаїе), и любая функция, принимающая РІ ЕНАМІЕ в пер- 
вом аргументе, может обрабатывать косвенные дескрипторы файлов так же, как 
прямые. Но ореп имеет одну особенность: если передать ей в качестве косвенного 


1 Используется по умолчанию, начиная с версии у5.8, выпущенной в 2002 


2 Если не используете прагму аџїой1е, которая позаботится о проверке за вас. 
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дескриптора файла неопределенную переменную, Рег! автоматически определит 
эту переменную, т.е. «самооживит» ее, поместив в нее ссылку на надлежащий де- 
скриптор файла. Одно из вытекающих преимуществ состоит в том, что дескрип- 
тор файла будет автоматически закрыт, когда не останется действующих ссылок 
на него, например, когда переменная выйдет из области видимости: 


{ 
ту $#һ; # (не инициализирована) 
ореп($?һ, >, "1одғі1е”) # $#һ самооживлена 
ог діе “Невозможно создать 109Ғі1е: $! “; 
# сделать что-то с $#ћ 
} в здесь $#һ закроется 


Объявление пу $#һ можно хорошо читаемым образом включить в орег: 
ореп(ту ФЕһ, ">" "109Ғі1е") || діе .. 


Символ > перед именем файла является примером режима. Изначально существо- 
вала форма ореп с двумя аргументами. Недавнее добавление формы с тремя аргу- 
ментами позволяет отделить режим от имени файла, чтобы они не смешивались. 
В следующем примере предполагается, что пользователь не пытается открыть 
файл, имя которого начинается символом ">. Мы можем быть уверены, что от- 
крывается в режиме ">" (записи) файл с именем в ЕХРӮ, при этом файл создается, 
если не существует, и размер файла усекается до нуля, если файл уже существует: 


ореп(10б, “> "100 11е") || діе "Невозможнс создать 109 11е: $!” 


В более коротких формах имя файла и режим находятся в одной строке. Строка 
анализируется во многом так же, как анализируется перенаправление файлов 
и каналов интерпретатором команд системы. Во-первых, из строки удаляются ве- 
дущие и замыкающие пробельные символы. Затем строка исследуется с обоих 
концов, если нужно, на наличие символов, указывающих, как должен быть от- 
крыт файл. Между режимом и именем файла допускается наличие пробельного 
символа. 


Режимы открытия файлов являются символами перенаправления в стиле интер- 
претатора команд. Список этих символов приведен в табл. 27.8. (Если требуется 
открыть файл в смешанном режиме доступа, не входящем в данную таблицу, об- 
ращайтесь к функции низкого уровня ѕуѕореп.) 


Таблица 27.3. Режимы для ореп 


Создать несу- 
ществующий 


Только 
для дополнения 


Режим Разрушить 


существующий 


Доступ 
для записи 


Доступ 
для чтения 


< РАТН Нет 

> РАТН Да 

>> РАТН Нет 

+< РАТН Нет 

+> РАТН Да 

+>> РАТН Да Нет 

| СОММАМО неприменимо | неприменимо неприменимо 


СОММАМО | неприменимо | неприменимо |неприменимо 
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Если установлен режим “<” или режим вообще не установлен, существующий 
файл открывается для чтения. В режиме ">" файл открывается для записи, что 
приводит к усечению существующих файлов и созданию несуществующих, 
а в режиме ">>" файл создается при необходимости и открывается на запись в ре- 
жиме, когда все данные автоматически записываются в конец файла. Если но- 
вый файл создается при использовании режима “>” или ">>", а файл ранее не су- 
ществовал, права доступа определяются текущим значением ипазк процесса со- 
гласно правилам, описанным для этой функции. 


Вот типичные примеры: 


ореп(ТМРО, “датаҒ11е”) || 91е( “невозможно открыть дафа Те: $! °); 
ореп(ТМЕО, < датағі1е”) || 91е(“невозможно открыть даїаћі1е: $!”); 
ореп(НЕЗИЕТ$, “> гипзфаф$”) || діе( "невозможно открыть гипзтатз: $!"); 
ореп(106, ">> Тодғі1е ") || діе( "невозможно открыть 109111е: $! “); 


Если вы предпочитаете сокращать количество знаков пунктуации, можете напи- 
сать так: 


ореп ІМЕО, “датағіје" ог діе “невозможно открыть дата?і1е: $! “; 
ореп ІМЕО, < датағі1е” ог 91е “невозможнс открыть датаҒі1е: $! "; 
ореп НЕЗИЕТ$, “> гипѕїаїѕ” ог діе “невозможно открыть гипѕїаїѕ: $! "; 
ореп 106, ">> Іодғі1е " ог діе "невозможно открыть 109111е: $! "; 


При открытии для чтения специальное имя файла ”-” обозначает ЭТОГ\. При от- 
крытии для записи это же специальное имя файла обозначает 5Т00Т. Обычно они 
задаются как “ “и ">-" соответственно. 


ореп(ІМРОТ, “-” ) || діе; # повторно открыть стандартный ввод для чтения 
ореп(ТМРОТ, "<-") || діе; # то же, но явно 
ореп(оОуТРуТ, “>-”) || діе; # повторно открыть стандартный вывод для записи 


Благодаря этому программе можно передать имя файла, которое вынудит ис- 
пользовать стандартный ввод или вывод, но автору программы не придется пи- 
сать код, чтобы узнать это. 


Любой из этих трех режимов можно также предварить знаком «+», чтобы открыть 
файл одновременно для чтения и записи. Тем не менее, знаки «меньше» и «боль- 
ше» по-прежнему определяют, будет ли файл усечен или создан, а также должен 
ли он уже существовать. Это означает, что "+<" почти всегда лучше для целей чте- 
ния/обновления, а сомнительный режим "+>" разрушит содержимое файла, пре- 
жде чем можно будет что-нибудь из него прочесть. (Устанавливайте этот режим, 
только если необходимо заново прочесть то, что было только что записано.) 


ореп(ОВАЅЕ, “+< дафаБазе”) 
|| діе “невозможно открыть существующую БД в режиме обновления: $! ' ; 


Файл, открытый в режиме обновления, можно рассматривать как базу данных 
с произвольным доступом и перемещаться к байту с заданным номером при помо- 
щи ѕеек, но переменная длина записей в обычных текстовых файлах обычно де- 
лает непрактичным использование режима чтения/обновления таких файлов. 
Иной подходе к обновлению предлагается в описании параметра командной стро- 
ки -і в главе 17. 


Если ведущий символ в ЕХРВ является символом канала (конвейера), ореп создаст 
новый процесс и соединит с ним дескриптор файла, открытый только для записи. 
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В результате можно осуществлять запись по этому дескриптору, и записанное бу- 
дет попадать на стандартный вњод команды. Например: 


ореп(РАТМТЕВ, “| 1рг -Р1р1”) || де “невозможно выполнить: $! ' 
ргіпі РАТМТЕЯ “зфиРР\п”; 
с1оѕе(РВІМТЕА) || діе “сбой Ірг/с1оѕе: $2/$!`, 


Если замыкающий символ в ЕХРЕ является символом канала, ореп также запустит 
новый процесс, но на этот раз подключит к нему дескриптор файла, доступный 
только для чтения. Благодаря этому вывод команды в 570007 появится в вашем 
дескрипторе для чтения. Например: 


ореп(МЕТ, “петзтае -1 -п |”) || діе "невозможнс выполнить $!” 
мһ:1е (<МЕТ>) { } 
с10зе(МЕТ) || дзе “невозможно закрыть петзтат: $! /$?”; 


Явно закрывая дескриптор файла канала, родительский процесс будет ожидать, 
когда порожденный процесс завершится и вернет код состояния в $? ($СНИО_ 
ЕВВОВ). Возможно также, что с10ѕе установит $! ($05$_ЕАВОВ). Примеры интерпрета- 
ции кодов ошибок вы найдете в описании с105е и ѕуѕіеп. 


Любая команда в конвейере, содержащая метасимволы интерпретатора команд, 
например, маски или символы перенаправления ввода/вывода, передается кано- 
ническому системному интерпретатору команд (/біп/ѕћ в (МХ), чтобы сначала 
были обработаны эти специфические для интерпретатора команд конструкции. 
Если метасимволы не обнаружены, Рег! запустит новый процесс сам, не вызывая 
оболочку. 


Для запуска конвейера можно использовать версию ореп с тремя аргументами. 
Эквивалентом предшествующего открытия канала в таком стиле будет: 


ореп(РАТМТЕН, “| “, “1рг -Р1р1") || дзе “невозможно выполнить : $! 
ореп(МЕТ, "-1". “пефзфае -1 -п”) || 91е "невозможно выполнить : $! “; 


Здесь знак «минус» во втором аргументе представляет команду в третьем аргу- 
менте. В данном примере интерпретатор команд не вызывается, но если необхо- 
димо гарантировать отсутствие обработки интерпретатором, в новых версиях 
Рег! можно сказать: 


ореп(РАТМТЕВ. `|-”, “рг”, “-Р1р1”) || діе “невозможно выполнить. $!" 
ореп(МЕТ, "- 1", “петзфае”, "-1", ”-п”} || діе "невозможно выполнить : $!”; 


Если для открытия канала в специальную команду или из специальной команды 
"7 используется версия ореп с двумя аргументами, сначала неявно вызывается 
Ғогк. (В системах, где ветвление не поддерживается, возникает исключение. 
В системах М1сгозой Гогк не поддерживалась до конца двадцатого столетия, но 
теперь поддерживается.) В данном случае знак «минус» представляет новый по- 
рожденный процесс, являющийся копией родительского. Возвращаемым значе- 
нием вызова ореп, выполнившего ветвление, является идентификатор дочернего 
процесса в родительском процессе, 0 — в порожденном процессе, и значение ипдег 
при неудаче ѓогк (в этом случае порожденный процесс не запускается). Например: 


1 Можно представлять себе это как пропуск команды в вышеприведенных версиях с тре- 
мя аргументами. 
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ту $р19 = ореп(ЕВОМ_СНТЬО, “-|“) // діе “невозможно выполнить : $! 


ЇР ($%ріа) { 

©рагепї_1іпеѕ = <ҒВОМ СНІГ р>, # код родителя 
} 
е15е { 

ргіпі 5ТрООТ @сһі1а 1іпеѕ; # код потомкё 
} 


В родительском процессе дескриптор файла ведет себя как обычно, но в порож- 
денном процессе 5Т000Т (или 5Т01№) оказывается связан с вводом (или выводом) ро- 
дительского процесса. Порожденный процесс не видит открытого дескриптора 
файла родительского процесса. (На это указывает РГУ, равный 0.) 


В общем случае эту конструкцию следует использовать вместо обычного вызова 
ореп, открывающего канал, если требуется больший контроль над выполнением 
команды в конвейере (например, при выполнении зей119), и нет желания прове- 
рять команды на присутствие метасимволов. Следующие операции открытия ка- 
налов примерно эквивалентны: 


ореп(ЕН, "| Г ‘а-2’° 'А-7“”); # канал в команду интерпретатора 
ореп(ЕН, “|-”, МЕГ", 7а-2“, "А-2" ); # канал в голую команду 

ореп(ЕН, “|-”) || ехес("г”, "а-2", "А-2") || діе; # канал в порожденный процесс 
ореп(ғ00, “|-”, "г" “а-2”, "А-2") || 91е; # канал в порожденный процесс 

как и эти: 

ореп(ЕН, “са -п "Ғі1е` |“); # канал из команды интерпретатора 
ореп(ЕН, “-|”, “са”, “-п”. "Рі1е”); # канал из голой команды 

ореп(ЕН, “-}”) || ехес "сат", ‘-п”, "Ғ11е") || 91е; # канал из порожденного процесса 
ореп(Е00, “-|”, "са", “-п”, $ғі1е) || 91е; Я канал из порожденного процесса 


Последние два примера в каждом блоке демонстрируют использование канала 
в «форме списка», которая поддерживается пока не на всех платформах. Основ- 
ное правило гласит, что если платформа поддерживает истинную функцию ѓогк 
(другими словами, если платформа — ОМІХ), можно использовать форму списка. 


Дополнительные примеры по этой теме можно найти в разделе «Анонимные кана- 
лы» главы 15. Более интересные примеры применения ореп, порождающей процес- 
сы, вы найдете в разделах «Разговор с самим собой» главы 15 и «Наведение по- 
рядка в окружающей среде» главы 20. 


Прежде чем выполнить ветвление процессов, Регі старается вытолкнуть буферы 
для всех файлов, открытых для записи, но на некоторых платформах эта особен- 
ность может быть не реализована. Для большей безопасности может потребовать- 
ся установить переменную $| (ФАУТОРЦИУЗН в модуле Епд11$1) или вызвать метод 
ато Тизй модуля 10::Напа1е для всех открытых дескрипторов файлов. 


В системах, поддерживающих флаг закрытия при ехес, он будет устанавливаться 
для вновь открываемых дескрипторов файлов, в соответствии со значением $`Е 
($ЗУЗТЕМ_РО_МАХ). 


Нопытка закрыть любой канал приостанавливает родительский процесс до завер- 
шения порожденного процесса и затем возвращает код состояния в $? и $!7СНІ!')_ 
ЕВВОЯ_МАТТУЕ}. 
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В именах файлов, передаваемых ореп с двумя аргументами, любые начальные 
и конечные пробельные символы удаляются, а обычные символы перенаправле- 
ния сохраняются. Эта особенность известна как «волшебное открытие» и часто 
используется с выгодой. Пользователь получает возможность указать имя файла 
вроде “гзп саї ?і1е |", а вы – возможность изменять некоторые имена файлов по 
своему усмотрению: 


фғі1епате =- $/(.*\.92)\$*$/921р -ас < $1|/, 
ореп(ЕН, $Ғі1епате) || діе "Невозможно открыть $111епате: $! "; 


При запуске команды с помощью ореп необходимо выбрать ввод либо вывод: "стӣ[' 
для чтения либо “|стд” для записи. Нельзя с помощью ореп запустить команду 
и открыть канал одновременно на ввод и на вывод, что, казалось бы, позволяет 
недопустимое (в данное время) обозначение "|сп|". Однако стандартные библио- 
течные подпрограммы ІРС::0реп2 и ІРС::0репЗ дают близкий эквивалент. Подроб- 
ности о двунаправленных каналах читайте в разделе «Двунаправленная связь» 
главы 15. 


В традициях оболочки Борна можно также начать выражение ЕХРП сочетанием >6; 
в таком случае оставшаяся часть строки интерпретируется как имя дескриптора 
файла (или указатель файла, если это число), который должен быть дублирован 
посредством системного вызова 4ир2(2).! Символ & можно использовать после >, >>, 
<, №, +> и +<, (Режим должен соответствовать режиму исходного дескриптора 
файла.) 


Это может понадобиться, если существует открытый дескриптор файла, и есть 
желание создать еще один дескриптор, являющийся точной копией первого. 


ореп(ЗАМЕОЦТ, “>&ЗАМЕЕВВ") || діе "невозможно дублировать ЗАМЕЕВВ: $! " 
ореп(МНСОМТЕХТ, "<&4") || діе “невозможно дублировать #04: $!”; 


Это значит, что если функция рассчитывает получить имя файла, но вы не хотите 
давать ей имя файла, потому что уже открыли файл, можете просто передать ей 
дескриптор файла, предварив его амперсандом. Однако лучше всего использо- 
вать полностью квалифицированный дескриптор файла, поскольку функция мо- 
жет находиться в другом пакете: 


зотегРипс Топ ("&та1лп: : СОСЕТЬЕ"); 


Другой причиной дублировать дескриптор файла может быть желание временно 
переадресовать текущий дескриптор, не потеряв при этом первоначального адре- 
сата. Следующий сценарий запоминает, переадресовывает и восстанавливает 
ЭТООЦТ и ЅТРЕВВ: 


#1 /изг/бзп/рег1 

изе у5. 14, 

ореп ЗАМЕСИТ, ">85Т000Т”; 
ореп ЅАМЕЕВА, ">&8ТрЕВА”, 


ореп(5ТрО0Т, ">Ғоо. ои”) || діе “невозможно перенаправить ѕїйоиї"; 
ореп( ТРЕВА, ">&5Т000Т") || діе "невозможно дублировать ѕїйоџї”; 


Это (пока) не работает для объектов ввода/вывода, созданных путем самооживления 
дескриптора файла, но для получения дескриптора файла и его дублирования всегда 
можно использовать Ѓі1епо. 
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ѕе1есї ЗТОЕНЯ, $| = 1 # включить автоматическую очистку буфера 
зе1ес{ 5Т000Т; $1 = 1 # включить автоматическую очистку буфера 
ѕау ЭТООЧТ “зЕдоит 1”, # эти потоки ввода/вывода распространяются 
Ѕау ЗТОЕАВ "ѕїдегг 1“; # также в подпроцессы 

зузтет( “зоте соттапб”); # использует новые ѕідоџё/ѕїдегг 


сІоѕе ТООЛ; 
с1оѕе 5ТОЕВЯ; 


ореп $ТООИТ, “>&$АМЕСИТ”; 
ореп ЅТОЕВА, “>&ЗАМЕЕВВ”; 


ѕау ТООТ “"зЕдоит 2", 
ѕау ЅТОЕВА "ѕёдегг 2”; 


Если дескриптору файла или номеру его указателя предшествует комбинация &=, 
а не просто 8, вместо создания совершенно нового дескриптора файла Рег] сдела- 
ет ЕПЕНАМІЕ псевдонимом существующего дескриптора с помощью функции 
Їаореп(8) из библиотеки С. При этом несколько экономятся системные ресурсы, 
хотя в теперешние времена это не столь важно. 


$74 = $ЕМУ{ "МНСОМТЕХТЕО” }, 
ореп(МНСОМТЕХТ, “<&=$Едпим”) 
|| 91е “невозможно выполнить Рдореп для дескриптора $Рдпит: $!": 


Дескрипторы файлов 5Т01М№, ЭТОООТ и ТРЕВА всегда остаются открытыми при вы- 
полнении ехес. Другие дескрипторы файлов, по умолчанию, — нет. В системах. 
поддерживающих функцию 1с1{1, можно модифицировать флаг дескриптора 
файла для закрытия при выполнении ехес. 


изе Еспіі ам(Е_СЕТЕО -_$ЕТЕО); 
$Ғ1адѕ = Есп1(ЕН, Е ЅЕТЕр, 0) 
|| 91е "Невозможно сбросить флаг закрытия при ехес для ЕН: $!” 


См. также описание специальной переменной $^Е ($5Ү5ТЕМ_ РО МАХ) в главе 25 


Используя ореп с двумя аргументами, следует проявлять осторожность, задейст- 
вуя строковую переменную в качестве имени файла, поскольку она может содер- 
жать произвольные таинственные символы (особенно если имя файла передано 
произвольными таинственными личностями через Интернет). Если не проявить 
осторожность, часть имени файла может быть интерпретирована как строка МОРЕ, 
пробельный символ, который можно опустить, признак необходимости дублиро- 
вания или знак «минус». Вот один исторически интересный способ принять меры: 


$ратһ =- 5#7(\5)#. /$1я; 
ореп (ЕН, “< $ратһ\о”) || Фе “невозможнс открыть $раїћ: $! "; 


И даже такой способ имеет несколько слабых мест. Лучше обратитесь к версии 
ореп с тремя аргументами, чтобы открывать произвольное имя файла аккуратно 
и без (дополнительной) угрозы для безопасности: 


ореп(ЕН, `, фра+һ) || діе “невозможно открыть $раїһћ: $! ": 


С другой стороны, если вам действительно нужен системный вызов ореп(2) в сти- 
ле С со всеми сопутствующими деталями и украшениями, возьмите зузореп: 
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изе Еспї1, 
зузореп(ЕН, $ратп, 0 ВООМУ) || сіе “невозможнс открыть $раїћ: $!" 


Если система различает текстовые и двоичные файлы, может потребоваться уста- 
новить двоичный режим (или воздержаться от этого), чтобы избежать искажения 
файлов. В таких системах результат попытки открыть двоичный файл в тексто- 
вом режиме или текстовый файл в двоичном режиме может вам не понравиться. 


Системы, где без біпподе не обойтись, отличаются от остальных по формату, ис- 
пользуемому для текстовых файлов. В системах, где біппойе не требуется, каждая 
строка завершается одним символом, соответствующим тому, что С понимает 
как перевод строки, – \п. В эту категорию попадает ОМХ, включая современные 
версии Мас ОБ. УМ$, МУЗ, МБ-всякие и прочие операционные системы типа 5&М 
реализуют ввод/вывод текстовых и двоичных файлов по-разному, поэтому в них 
нужно использовать 01птоде. 


Или ее эквивалент. Двоичный режим можно устанавливать в функции ореп, не 
вызывая біпподе отдельно. В аргументе МОДЕ (но только в версии с тремя аргумен- 
тами) можно подключать различные фильтры ввода и вывода. Чтобы обойтись 
без біппойе, используйте версию ореп с тремя аргументами и упомяните фильтр 
гам после остальных символов МОЕ: 


ореп(ЕН "< гам”. $ратћ) || діе "невозможно открыть $раїћ: $!”; 


См. описание модуля Епсоде в главе 6, где описывается, что еще можно помещать 
сюда, включая обработку текстовых файлов в УЯпдо\з. 


Е РУХ в 
орепаіг Я дс Е. Г 1 
орепаіг ОТННАМОГЕ, ЕХРВ 


Открывает каталог с именем ЕХРА для работы с ним с помощью функций геа091г, 
1е1191г, ѕеекдіг, геміпддіг и с105е01г. Возвращает истинное значение в случае успе- 
ха. Дескрипторам каталогов отводится собственное пространство имен, отделен- 
ное от пространства имен дескрипторов файлов. 


ога [$] 


ога ЕХРЕ 
ога 


Возвращает числовое значение (код) первого символа в ЕХРЕ. Возвращаемое значе: 
ние всегда беззнаковое. Если нужно получить значение со знаком, используйте 
ипраск("с”, ЕХРВ). Чтобы преобразовать все символы строки в список чисел, выпол- 
ните ипраск(”0*”, ЕХРВ). Чтобы отыскать код символа по его строковому имени, 
используйте функцию сһагпапеѕ::уіапапе из прагмы сһагпапеѕ. 


ОГ 


оиг ТУРЕ ЕХРЕ : АТТАТВИТЕ$ 
сиг ЕХРЯ . АТТВТВИТЕ$ 

сиг ТУРЕ ЕХРВ 

оиг ЕХРВ 


Оператор сиг объявляет одну или несколько переменных как глобальные в охва- 
тывающем блоке, еха1 или файле. Объявление оџг подчиняется таким же прави- 


856 Глава 27. Функции 


лам видимости, как объявление пу, но не создает новую закрытую переменную, 
а просто разрешает свободное обращение к существующей в пакете глобальной 
переменной. Если перечислено несколько переменных, список должно заклю- 
чить в круглые скобки. 


Основная цель объявления оиг — скрыть переменную от действия объявления изе 
5{г1С{ “уагъ”; поскольку переменная маскируется под переменную пу, можно ис- 
пользовать объявленную заким образом глобальную переменную, не квалифици- 
руя ее именем пакета. Однако, как и в случае переменной пу, это правило действу- 
ет только в пределах лексической области видимости объявления оиг. В этом от- 
ношении оно отличается от директивы изе уагз, воздействующей на весь пакет 
и не ограничивающейся лексической областью видимости. 


Объявление оиг похоже на пу и в том, что позволяет объявлять переменные с пара: 
метрами ТУРЕ и АТТАІВІТЕЅ. Например: 


оог 009 $$роЕ .еагѕ(ѕһогЕ) :+ај1(10п9), 


На момент написания этих строк не вполне ясно, во что это выльется. Атрибуты 
могли бы воздействовать на глобальную или локальную интерпретацию $рої. 
С одной стороны, было бы более всего похоже на переменные пу, если бы атрибуты 
охватывали текущее локальное представление $5рої, не трогая другие представ- 
ления глобальной переменной в иных местах. С другой стороны, если в одном мо- 
дуле объявлено, что $5рої — это 009, а в другом, что $5рої – это Саї, можно прийти 
к мяукающим собакам и лающим котам. Это составляет предмет проводимых 
в настоящее время исследований, — это мы так витиевато признаемся, что пока не 
понимаем того, что обсуждаем. 


Другое сходство между оиг и пу заключается в области видимости. Объявление оџг 
объявляет глобальную переменную, которая будет видима во всей лексической 
области видимости, даже через границы пакетов. Пакет, которому будет принад: 
лежать переменная, определяется местонахождением объявления, а не точкой 
использования. Это значит, что следующее поведение можно считать характер- 
ной особенностью: 


раскаде Ғоо; 
оог $раг; п $баг представляет собой $Еоо: : баг до конца лексической области 
фраг = 582; 


раскаде Ваг; 
ргіпЕ $баг; # выводит 582, как если бы “оиг” было “ту” 


Одно из отличий состоит в том, что пу создает новую закрытую переменную, а ог 
делает видимой существующую глобальную переменную, что особенно важно 
в операциях присваивания. Если объединить присваивание на этапе выполнения 
с объявлением оиг, значение, присвоенное глобальной переменной, не исчезнет, 
когда оиг выйдет из области видимости. Для этого потребуется 10са1: 


($х, Фу) = (один”, "два"); 
ѕау “перед блоком х равно $х, у равно $у”; 
{ 

сиг $х = 10; 

10са1 оиг $у = 20; 

зау "в блоке х равно $х, у равно $у”, 
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} 


зау “после блока х равно $х, у равно $у“; 
Вывод будет таким: 


перед блоком х равно один, у равно два 
в блоке х равно 10. у равно 20 
после блока х равно 10, у равно две 


Многократные объявления оџг в одной и той же лексической области допускают- 
ся, если они находятся в разных пакетах. Если они находятся в одном пакете, 
Рей выдает предупреждения, когда его об этом просят. 


изе магп1п9$; 

раскаде Ғоо; 

оог $баг; # объявляет $Роо::фа" до конца лексической области 
фраг = 20, 


раскаде Ваг; 
сиг Фбаг = 30; # объявляет $Ваг: Баг до конца лексической области 
ргіпі $баг; # выведет 30 


оиг $баг: # выведет предупреждение 


См. описание 10са1, пу и ѕїаѓе, а также раздел «Объявления с областью видимо- 
сти» главы 4. 


раск ба! 
раск ТЕМРЕАТЕ, 11Т 


Принимает список [15Т обычных значений Регі, преобразует их в строку байтов 
согласно шаблону ТЕМРІАТЕ и возвращает эту строку. Шаблоны для функций раск 
и ипраск описываются в главе 26. 


раскаде 


раскаде МАМЕЗРАСЕ ИЕВУТОМ ВІОСК 
раскаде МАМЕЗРАСЕ ИЕВЗТОМ 
раскаде МАМЕЅРАСЕ ВЕОСК 

раскаде МАМЕЅРАСЕ 


На самом деле, это не функция, а объявление, которое говорит, что блок ВЕОСК или 
оставшаяся часть наиболее глубоко вложенной охватывающей области видимо- 
сти принадлежит указанной таблице символов или пространству имен. (Область 
видимости объявления раскаде, таким образом, такая же, как у объявлений пу, 
ѕїаїе или оџг.) Внутри своей области видимости объявление заставляет компиля- 
тор разрешать все неквалифицированные глобальные идентификаторы путем по- 
иска их в таблице символов объявленного пакета. 


Объявление раскаде действует только на глобальные переменные – в том числе те, 
с которыми использован оператор 10са1, – не лексические переменные, созданные 
с помощью пу, ѕїаїе или оиг. Оно воздействует только на неквалифицированные 
глобальные переменные – глобальные переменные, квалифицированные именем 
собственного пакета, игнорируют текущий объявленный пакет. Глобальные пе- 
ременные, объявленные с помощью ош, – неквалифицированные и потому учи- 
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тывают текущий пакет, но только в точке объявления, после чего ведут себя как 
переменные пу. То есть в оставшейся части лексической области видимости пере- 
менные оиг «прикрепляются» к пакету, используемому в точке объявления, даже 
если будет встречено новое объявление пакета. 


Обычно объявление раскаде помещается в начало файла, который должен быть 
включен с помощью оператора геци1ге или џиѕе, но можно поместить его в любое 
место, где допускается инструкция. При создании файла обычного или объектно- 
ориентированного модуля пакету часто дают то же имя, что и файлу, чтобы избе- 
жать путаницы. (Принято также именовать такие пакеты с заглавной буквы, по- 
скольку модули, названия которых начинаются со строчной буквы, принято ин- 
терпретировать как модули прагм.) 


Можно переключаться в конкретный пакет более чем в одном месте. Это влияет 
только на выбор таблицы символов, используемой компилятором в оставшейся 
части блока. (Если компилятор видит другое объявление раскаде на том же уров- 
не, новое объявление получает более высокий приоритет, чем предыдущее.) 
Предполагается, что основная программа начинается с невидимого объявления 
раскаде та1п- 


Если присутствует аргумент УЕРЗТОМ, оператор раскаде присваивает переменной 
$\ЕВЗТОМ, находящейся в данном пространстве имен, объект уегѕіоп с указанным 
значением УЕЛЗТОМ. Аргумент УЕЯ5ТОМ должен содержать номер версии ь «строгом» 
формате, как определено прагмой уегѕіоп: положительное десятичное число (це- 
лое или вещественное) без обозначения экспоненты или У-строка в десятично-то- 
чечной нотации с ведущим символом уи, как минимум, с тремя компонентами. 
(В будущем это требование может быть ослаблено до двух компонентов, по мере 
того, как программисты начнут привыкать пользоваться объектами версий.) Пе- 
ременная $\ЕВЗТОМ должна определяться в пакете только один раз. 


Ссылаться на переменные, подпрограммы, указатели и форматы в других паке- 
тах можно, квалифицируя идентификатор именем пакета и двойным двоеточи- 
ем: $Раскаде::Магіабр1е. Если имя пакета не указано, предполагается пакет паіп. 
Это значит, что $::5а11 эквивалентно $паіп::5аі1, а также $та1п'5а11, что иногда 
еще можно встретить в старом коде. 


Следующий пример: 


раскаде паіп; $за11 = “па1е апа пеагфу”; 
раскаде Мі22еп; $ѕаі1 = “Чаїїегей”; 
раскаде Ипатеуег; 

ѕау “Му таіп ѕаі1 1$ Фтаіп: :3а11.”; 

ѕау "Му т1хтеп за11 15 $М172еп: :ѕаі1." 


Выведет: 


Му паіп за11 1$ һа1е апа һеагїу. 
Му пі27еп ѕаі1 1$ Таїтегеа. 


Таблица символов пакета хранится в хеше, имя которого заканчивается двумя 
двоеточиями. К примеру, таблица символов пакета паіп называется %паіп::. По- 
этому к символу *паіп::5211 можно также обратиться конструкцией $та1пт: :{"за11"}. 


Дополнительные сведения о пакетах вы найдете в главе 10. Описание пу (приве- 
денное ранее в этой главе) дает информацию по другим вопросам, связанным с об- 
ластями видимости. 


Функции Реп в алфавитном порядке 859 


__РАСКАСЕ__ 


Специальная лексема, возвращающая имя пакета, в котором она встретилась. 
См. главу 10. 


ріре Свет 0] 


ріре АЕАРНАМОГЕ, ИВТТЕНАМОЕЕ 


Как и соответствующий системный вызов, открывает пару связанных каналов — 
ем. ріре(2). Обычно вызывается непосредственно перед ѓогК, после которого про- 
грамма чтения из канала должна закрыть ИВТТЕНАМОЕЕ, а программа записи за- 
крыть РЕАОНАМОГЕ. (Иначе канал скроет ЕОЕ от программы чтения, когда будет за- 
крыт программой записи.) Когда два процесса соединяются каналами, обеспечи- 
вающими двунаправленный обмен, может произойти взаимоблокировка, если не 
проявить особую осторожность. Кроме того, обратите внимание, что каналы Рег] 
используют буферизацию стандартного ввода/вывода, поэтому может потребо- 
ваться установить $| ($00ТРУТ_АОТОРЕЦИЗН) для ИВТТЕНАМОЕЕ, чтобы очищать буфер по- 
сле каждой операции вывода в зависимости от приложения — см. 5е1ест{ (дескрип- 
тор выходного файла). 


(Как и в ореп, если один из файловых дескрипторов не определен. он будет «само- 
оживлен».) 


Вот небольшой пример: 


ріре(ВЕАРМЕ, МВТТЕМЕ) 


ип1еѕљ ($р19 = РогКк) { # потомок 
деғіпед($ріа) || діе “невозможно создать потомка: $! ": 
с1озе(ВЕАОМЕ); 
Рог $1 (1..5) { ргіпі МВІТЕМЕ “строка $1\п” } 
ехії; 


} 

$5Т0{СНІЮ} = зиб { ма1тр1а($р2а, 0) } 
сІоѕе(мМВІТЕМЕ); 

@5ігіпдѕ = <ВЕАРМЕ>; 

с1оѕе(ВЕАОМЕ); 

ргіпі “Получено :\п", @ѕїгіпо5; 


Обратите внимание, как записывающий код закрывает конец для чтения, а чи- 
тающий код закрывает конец для записи. Нельзя организовать двустороннюю 
связь при помощи одного канала. Для этого необходимы два разных каналғ или 
системный вызов ѕоскеїраіг. См, раздел «Каналы» главы 15. 


рор е 


рор АВНАУ 
рор 


Данная функция интерпретирует массив АВЁАУкак стек — она выталкивает (удаля- 
ет) и возвращает последнее значение в массиве, укорачивая массив на один эле- 
мент. Если АРРАУ опущен, выталкивает @ в лексической области видимости под- 
программ и форматов; выталкивает @АВСУ в области видимости файлов (обычно ос- 
новной программы) или внутри лексических областей видимости, установленных 
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конструкциями е\уа1 СТАТМС, ВЕСТМ {}, СНЕСК {}, ОМТТСНЕСК {} и ЕМ№ {}. Оказывает та- 
кой же эффект, как: 


$етр = ФАВВАУЕ$ВАВВАУ--]; 
или: 
$1тр = $р11се @АВВАУ, -1; 


Если в массиве нет элементов, возвращает ипіеѓ. (Но не полагайтесь на это, чтобы 
определять момент, когда массив опустеет, если он содержит значения ипдей) 
См. также риѕћ и ѕћіѓї. Если требуется вытолкнуть более одного элемента, ис- 
пользуйте $р] 1се. 


Функция рор требует, чтобы ее первый аргумент был массивом, а не списком. Ес- 
ли требуется просто извлечь последний элемент списка, используйте 


( ы$Т )[-1] 


Начиная с версии у5.14, функция рор может принимать ссылку на «неосвящен- 
ный» массив, которая будет разыменована автоматически. Данная особенность 
рор пока является экспериментальной. Ее поведение может измениться в буду- 
щих версиях Рег]. 


роз [5] 


роз САГАЯ 
роѕ 


Возвращает позицию в 5САГАБ, где закончился последний поиск п//д в этом скаляре. 


Возвращает смещение символа (кода), следующего за последним найденным сим- 
волом (равносильно выражению 1епоїћһ($`) + 1епотп($&)). С этой позиции начнется 
следующий поиск п//9 в данной строке. Запомните, что смещение начала строки 
равно 0. Обратите внимание, что значение 0 является допустимым смещением, 
полученным в результате поиска. Значение ипде{ указывает, что позиция поиска 
сброшена (обычно из-за отсутствия соответствия, но это же значение возвращает- 
ся, если поиск в строке вообще не производился.) 


Например: 


фога??іїо = “Рее Ғіе Ғое Гос“; 
мһіЛе (фогағѓіїто =- п/е/д) { 
зау роз фога то; 
} 


выведет 2, 3, 7 и 11, т.е. смещения всех символов, следующих за "е". Функции роѕ 
можно присвоить значение, чтобы сообщить, где нужно начать следующий поиск 
п//9: 

фогағғіто = "Ғее Ғіе Ғое оо”; 

роз ФогаЕЕ1То = 4; # Пропустить Рее, начать с Не 

мһі1е ($огағ?іто =- п/е/д) { 

зау роз $д9га Ро; 
} 


Этот фрагмент выведет только 7 и 11. Утверждение \б в регулярном выражении 
соответствует только текущей позиции, которая указывается функцией роѕ для 
строки, где производится поиск. См. раздел «Позиции» главы 5. 
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Обратите внимание, что здесь говорится о кодах символов, а не о символах. Нам 
не хотелось бы вводить вас в заблуждение. Коды — это символы, видимые про- 
граммисту, некоторые из них могут быть невидимы для пользователя. Символы, 
которые видит пользователь, и которые обычно называются графемами или 
групповыми графемами, могут состоять из нескольких кодов. Например, после- 
довательность "\г\п” – это один символ для пользователя, но два символа для про- 
граммиска. Если вам необходима версия роз, работающая с графемами, а не ско- 
дами, загляните в модуль Џпісоде::005їгіпо, опубликованный в СРАМ. 


рипе 5) ў А 
ргіпі ЕТЬЕНАМОЕЕ 1 ТТ 
ргіпі ЕТЕЕНАМОЕЕ 
ргіпі #157 
ргіпї 


Выводит строку или список строк, разделенных запятыми. Если установлена пе- 
ременная $\ ($00ТРИТ_ВЕСОВО_ЗЕРАВАТОН), ее содержимое выводится в конце списка. 
Функция возвращает истинное значение в случае успеха и ложное в противном 
случае. Между элементами списка [15Т выводится текущее значение переменной 
$. (если установлено). В конце списка / 157 выводится текущее значение перемен- 
ной $\ (если установлено). 


Чтобы вывести содержимое $_ в Е! ЕНАМЛ Е, следует использовать действительный 
дескриптор файла, такой как ГЕН, а не косвенный, как $11. ЕПЕНАМИЕ может быть 
именем скалярной переменной (без индекса), и тогда переменная содержит либо 
имя фактического дескриптора файла, либо ссылку на какой-либо объект де- 
скриптора файла. Как и любой другой косвенный объект, РІ ЕНАМ' Е может также 
быть блоком, возвращающим уместное значение: 


ргіпі { $0К ? “5ТОбИТ" — “ЗТОЕВВ” } “всячина\п”; 
ргіпе { $10папа1е $1] } “всячина\п”, 


Если аргумент Е11ЕНАМОЕЕ является переменной, а очередная лексема – термом, он 
может быть ошибочно принят за оператор, если не вставить знак + или не заклю- 
чить аргументы в скобки, например: 


ргіпт Фа - 2; # выведет $а - 2 в дескриптор по умолчанию (обычно $Т000Т) 
ргіпі $а (- 2); # выведет -2 в дескриптор, заданный в $а 
ргіпт $а -2; # выведет -2 (таинственные правила синтаксического анализа :-) 


Если РП. ЕНАМІЕ опущен, осуществляется вывод в дескриптор файла, выбранный 
в настоящий момент; первоначально это 51000Т. Чтобы по умолчанию для вывода 
использовался другой дескриптор, отличный от 510007, используйте операцию 
зе1есе Е ЕНАМІЕ Если {157 тоже опущен, выводится содержимое $_. Поскольку 
ргіпі принимает список. содержимое [157 вычисляется в списочном контексте. 
Поэтому, если сказать: 


ргіпі О0Т <5Т0ІМ; 


1 Поэтому в действительности 510007 не является дескриптором файла по умолчанию 


для ргіпї. Это лишь значение по умолчанию для дескриптора файла по умолчанию. 
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будет выводиться не очередная строка, а все оставшиеся строки из стандартного 
ввода вплоть до конца файла, потому что именно это <5Т01№ возвращает в списоч- 
ном контексте. Если требуется другое, скажите: 


ргіпїі ОЦТ зса1аг <$5ТОТ№; 


Кроме того, помня правило «все, что похоже на функцию, функцией и является», 
следите за тем, чтобы за ключевым словом ргіпї не следовала левая круглая скоб- 
ка, если только вы не хотите, чтобь соответствующая правая круглая скобка за- 
вершала аргументы ргіпї, – вставьте знак + или заключите в круглые скобки все 
аргументы: 


ргіпё (1+2)*3, “"\п"; = в НЕВЕРНО 
ргіпі +(1+2)*3, \п”; вок 
рг1пЕ ((1+2)*+3, "\п"), # ок 


При вызове с аргументом ЕЕНАМОЕ аргумент / 157 можно опустить, только если 
ЕПЕНАМІЕ является обычным «голым словом» дескриптора файла, а не блоком 
или косвенным дескриптором файла. 


$ = "всячина\п”; 
*МЕМОЙТ = *5Т000Т, 
ргіпі МЕМООТ; # ок: выведет “всячина\п” 


ФЕН = *МЕМОЦТ; 
ргіпі Ф#һ; # НЕВЕРНО: выведет $ТОО0Т “ «та2п: : ТООТ" 


Вывод Юникода в дескриптор файла, при открытии которого не был упомянут 
фильтр ввода/вывода, определяющий порядок кодирования, приводит к неот- 
ключаемому предупреждению «іе сһагасіег іп рыл (широкие символы в вы- 
воде). Чтобы исправить проблему, укажите кодировку с помощью біппойе или пе- 
редайте ее во втором аргументе версии функции орег с тремя аргументами. 


ріптоде($ТрО0Т, “:иЕР8”) || 91е "Ошибка вызова біптоде: $!” 
ореп(нНАМОЕЕ, “> :епсодіпо(ОТЕ-16)" $#11е) 
|| 91е "Невозможно открыть файл $#11е: $! "; 


Вывод в закрытый канал или сокет вызовет появление сигнала 516РІРЕ. См. раз- 
дел «Сигналы» в главе 15. 


ріпи [5-Я ме 


ргіпі? РЕТЁЕНАМОЕЕ РОВМАТ, 115Т 
ргіпі? АОВМАТ, [15Т 

ргіпі? АІ ЕНАМІЕ 

ргіпіғ 1157 

рип 


Выводит форматированную строку в ЕПЕНАМИЕ или, если он опущен, в текущий 
дескриптор файла; первоначально это 570007. Первым элементом [157 должна 
быть строка, в которой указано, как форматировать остальные элементы. Дейст- 
вует аналогично функциям ргіпі (8) и ѓргіпі/(3) из библиотеки С и эквивалентна 
следующей конструкции: 


ргіпі ЕПЕНАМОЕЕ зргапеЕ РОВМАТ, ЕТ5Т 
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за исключением того, что $\ ($00ТРИТ ВЕСОВО_ЅЕРАВАТОВ) не добавляется в конец вы- 
вода. 


Описание порядка интерпретации форматов приводится в главе 26. Мы могли бы 
продублировать всю приведенную в этой главе информацию здесь. но эта книга 
и так уже стала экологической катастрофой. 


Исключение возникает, только если в аргументе РП ЕНАМІ Е задан недопустимый 
тип ссылки. 


Если опустить оба аргумента, РОПМАТ и /157, используется $_ — но в таком случае 
следовало остановить выбор на ргіпі. Не попадайтесь в ловушку, применяя ргіпі? 
там, где достаточно обычной ргіпі. Функция ргіпї более эффективна и менее под- 
вержена ошибкам. 


ргоїоїуре Акс 
ргототуре РИМСТТОМ 


Возвращает прототип функции в виде строки (или опдеТ, если у функции нет про- 
тотипа). РИМСТТОМ представляет собой ссылку на функцию или имя функции, про- 
тотип которой требуется получить. 


Если РИМСТПОМ является строкой, начинающейся последовательностью С08Е::, ос- 
тавшаяся часть считается именем встроенной функции Регі. и если такой встро- 
енной функции нет, возникает исключение. Если встроенная функция не переоп- 
ределяема (например, 00//) или ее аргументы нельзя выразить прототипом (на- 
пример, ѕузѓеп), функция возвращает ипіеї, поскольку встроенная функция ведет 
себя в действительности не так, как функция Рег]. В противном случае возвраща- 
ется строка, описывающая эквивалентный прототип. 


риѕћ ако 
риѕһ АВНАУ, ЕТ5Т 


Интерпретирует массив АВРАУ как стек и вталкивает значения из списка [157 в ко- 
нец АННАҮ. Длина АННАУ возрастает на длину ; 157. Возвращает новую длину масси- 
ва. Функция риѕћ действует так же, как: 


Рог му $уаше (11$1Рипс()) { 
фаггау[++$ваггау] = $уа1ше; 
} 


или: 
$р11се баггау, @аггау, 0, 115Рипс(); 


но более эффективно (для вас и вашего компьютера). Функцию ризп можно соче- 
тать с функцией ѕпіѓї, чтобы создать быстродействующий регистр сдвига или 
очередь: 


Тог {;;) { 
риѕһ @аггау, ѕһі?ї @аггау; 


} 


См. также рор и ипзћіѓї. 


864 Глава 27. Функции 


Начиная с версии у5.14, риѕћ может принимать ссылку на «неосвященный» хеш 
или массив, которая будет разыменована автоматически. Эта особенность риѕћ 
считается экспериментальной. Ее поведение может измениться в будущем. 


а/8ТКІМС/ 


д/ТАІМС/ 

да/ЅТРІМ/ 
дг/5ТРІМ/ 
ом/$ТАТМС/ 
Чх/бТВІМ/ 


Обобщенные кавычки. См. раздел «Выберите собственные кавычки» главы 2. Све- 
дения о коде завершения 0х// вы найдете в описании геайріре, а сведения о коде за- 
вершения (г// – в описании п//. См. также раздел «Управление процессом» главы 5. 


аиоїетеѓа ра 


дуотетефа ЕХРВ 
дуотетета 


Возвращает значение ЕХРЯ, добавляя обратную косую черту перед всеми символа- 
ми, не являющимися буквами или цифрами. (То есть, обратная косая черта по- 
явится перед всеми символами, не входящими в множество /[А-7а-7_0-9]/, незави- 
симо от национальных настроек.) Это – внутренняя функция, реализующая 
еѕсаре-последовательность \0 в интерполируемых контекстах (строках в двойных 
кавычках, обратных апострофах и шаблонах). 


гапа 


гапа ЕХРЯ 
гапа 


Возвращает псевдослучайное число с плавающей запятой, большее или равное 0 
и меньшее значения ЕХРА. (Значение ЕХРА должно быть положительным.) Если вы- 
ражение ЕХРВ опущено, возвращает число с плавающей запятой между О и 1 
(включая 0, но исключая 1). гапд автоматически вызывает функцию у5гапӣі, если та 
еще не вызывалась. См. также ѕгаго. 


Чтобы получить случайное целое число, например, для моделирования игры 
в кости, объедините гапі с 111, как показано ниже: 


$го11 = 1пт(гапа 6) + 1; # $го11 теперь число между 1 и 6 


Поскольку Ре! использует функцию псевдослучайных чисел из библиотеки С, на- 
пример гапаот(8) или 4гап448(3), качественное распределение не гарантируется. 
Если требуется более сильная случайность, например, для целей криптографии, 
можете обратиться к документации по гапаот (4) (если у вас в системе есть устрой- 
ство /4ео/гапдот или /4еи/игап4от), к модулям Матн: :Напдот: :Зесиге, Маїћ::Вапаоп:: 
МТ::Рег1 и Матн: :ТгиїуВапдоп в СРАМ или прочитать хороший учебник по генерации 
псевдослучайных чисел на компьютерах, например второй том Кнута.! 


1 Д.Кнут «Искусство программирования. Получисленные алгоритмы», том 2, 3-е изде- 
ние. – Пер. с англ. – Вильямс, 2011. 
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геа [# т пе 


геад ТІ ЕНАМЮГЕ. ЅСАГАА, ЁЕМСТН, ОРЕЗЕТ 
геай ЕТІ. ЕНАМОГЕ, ЅСАГАВ, ТЕМСТН 


Пытается прочесть і ЕМТН символов (в смысле кодов символов, а не графем) в пере- 
менную САГАЙ из дескриптора файла РП ЕНАЛІЕ. Бозвращает число прочитанных 
символов или 0, если достигнут конец файла. В случае ошибки возвращает ипаеї. 
САГА растет или сокращается в зависимости от фактически прочитанной длины. 
Значение ОҒҒЅЕТ, если задано, определяет смещение в переменной 5САГ АВ, благода- 
ря чему запись можно выполнять в середину строки. 


Чтобы скопировать данные из дескриптора файла ГРОМ в дескриптор файла ТО, 
можно сказать: 


мһђі1е (геад(ЕВОМ, Фи, 16384)) { 
ргіпі ТО $6иғ; 
} 


Обратите внимание на слово «символов»: в зависимости от параметров дескрипто- 
ра файла, читаться будут либо байты (восьмибитные значения), либо символы. 
Байты — это всего лишь способ представления недекодированных кодов символов 
с маленькими значениями в Рец. По умолчанию все дескрипторы файлов опери- 
руют байтами. Но если дескриптор файла открыт, например, с фильтром ввода/ 
вывода :иї#8, операции будут выполняться над символами Юникода в кодировке 
ОТЕ-8, а не над байтами. Аналогичный фильтр ввода/вывода можно упомянуть 
при вызове біпподе с двумя аргументами, в среднем аргументе орел или в прагме 
ореп: во всех этих случаях можно будет прочитать практические любые символы. 


Противоположность геа4 составляет простая функция ргіпї, которая уже знает 
длину записываемой строки и может записать строку любой длины. Было бы 
ошибкой использовать "ге, работающую исключительно с форматами. 


Функция геад реализована через функцию стандартного ввода/вывода /геаа (8), 
поэтому фактический системный вызов геа0(2) может прочесть больше символов, 
чем определено аргументом [ ЕМСТН, чтобы заполнить входной буфер, а [геа4(З) мо- 
жет выполнить более одного системного вызова геа4(2), чтобы заполнить буфер. 
Чтобы получить более полный контроль, используйте зугеад, указывая требуе- 
мый системный вызов. Вызовы геад и эузгеад не должны перемежаться (разве что 
вам требуется сильнодействующее колдовство или головная боль). 


геадаіг СТРУ ЕУ 


геаад1г ОТАНАМОЕЕ 


Читает записи каталога (являющиеся простыми именами файлов) из дескрипто- 
ра каталога, открытого функцией орепііг. В скалярном контексте возвращает 
очередную запись, если таковая имеется, в противном случае возвращает ипдеї. 
В списочном контексте возвращает все оставшиеся записи или пустой список, ес- 
ли записей больше нет. Например: 


орепа1 г(ТНІЅОІВ, “ ) || 91е "ѕегіоиѕ даіпргападе: $!", 
@а11ғ11еѕ = геаддіг ТНІЅРІВ; 

с10ѕедіг ТНТЗОТЕ, 

зау "@а11#11е5”; 
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Этот код выведет имена всех файлов в текущем каталоге в одну строку. Если тре- 
буется исключить записи `` и ` `, используйте любое из следующих заклина- 
ний, которое сочтете наиболее понятным: 


@а11#11еѕ = дгер { $ пе ".” && $ пе ”..” } геадд1г ТНТ$ОТВ; 
@а11ғі1еѕ = дгер { ! /Г. ]Е. ]7\2/ } геаддіг ТНІЅ0ІВ; 
@а11ғі1еѕ = дгер { ! /^\. {1,2}\2/ } геаЧ91г ТНТЗОТА; 
@а11ғ11еѕ = дгер ! /7\.\.?\2/, геайбіг ТНТЗОТВ; 


Чтобы избежать вывода всех файлов + (как в программе /3): 
@а11#11еѕ = дгер !/^\./, геаддіг ТНІЅрІВ; 

Чтобы получить только текстовые файлы: 
@техїғі1еѕ = огер -Т, геаддіг ТНТЗОТН; 


Но будьте внимательны с последним вариантом, потому что к результату геадііг 
нужно снова «приклеить» часть, указывающую каталог, если это не текущий ка- 
талог, например: 


орепа1г(ТНАТОТА, $раїћ) || діє “невозможно выполнить орепдіг фраїћ: $!” 
@доіғі1еѕ = дгер { /^\./ && -Г } тар { "Фраїһ/%_" } геадд1г(ТНАТОТВ); 
с10ѕедіг ТНАТОІВ; 


Начиная с версии у5.12 вызов геабйіг можно использовать в цикле мћі1е. В этом 
случае очередной результат будет сохраняться в переменной $ _. В качестве де- 
скриптора можно также использовать скалярную переменную с неопределенным 
значением. В этом случае она автоматически будет инициализирована аноним- 
ным дескриптором каталога. 


пу $аһ; # гарантировать создание новой переменной 
орепдіг(Фаһ, Фѕотедіг) || діе “невозможно орепдіг $зотед1г: $! "° 
мпі1е (геадаіг($аһ)) { 

ргіпї “$зотед1г/$_\п”; 
} 
о1оѕедіг $98; 


: ГХК 
геадііпе УТ АА МЕ 
геад1іпе ЕТЕЕНАМОЕЕ 
геад1іпе 


Реализующая оператор <ҒІ/ НАМІ Е> внутренняя функция, с которой можно рабо- 
тать непосредственно. Функция читает очередную запись из РІ! ЕНАМІЕ, который 
может быть именем дескриптором файла или выражением косвенного дескрип- 
тора файла, возвращающим либо имя фактического дескриптора файл&, либо 
ссылку на нечто напоминающее объект дескрипторг. файла, например фуре?1оЪ. 
В скалярном контексте каждый вызов считывает и возвращает очередную за- 
пись, пока не будет достигнут конец файла, и тогда очередной вызов вернет ипіеї. 
В списочном контексте геай1іпе читает записи, пока не будет достигнут конец 
файла, и возвращает список записей. Под «записью» обычно понимается строка 
текста, но если присвоить переменной $/ (Ф1М№РОТ ВЕСОВО_ЅЕРАВАТОВ) иное значение, 
отличное от значения по умолчанию, этот оператор начнет «нарезать» текст по- 
другому. Неопределенное значение в $/ увеличит размер фрагмента до размеров 
целого файла. 
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При чтении файлов целиком в скалярном коһтексте, когда файл пуст, первый вы- 
зов геад1іпе вернет "”, а каждый следующий – ипдег. При чтении файлов целиком 
из волшебного дескриптора файла АВС\, для каждого файла возвращается один 
фрагмент (и здесь пустые файлы возвращаются как ""), а когда все файлы будут 
прочитаны, последует одно значение ипіеї. Если ГРІ ЕНАМІЕ опущен, используется 
дескриптор файла АВС\. 


Оператор <ЕТЁЕЕНАМОЕЕ> более подробно описываегся в разделе «Операторы ввода» 
главы 2. 


$1іпе = <5Т0ІМ; 

ф1іпе = геад1іпе(5Т01М№); # то же самое 
$11пе = геад11пе(*«5ТОТМ), # то же самое 
$11те = геад11пе(\*5Т0Т№); # то же самое 


ореп(ту $#һ, “<&=5ТрІМ") || 91е; 
р1е$5($#һ => “АпубТаС1азз”); 


$11пе = геадјіпе(%Фғһ): # то же самое 

геаЧИпк Ра СТАЛУ 
геад11пк ЕХРЕ 
геад) іпк 


Возвращает имя файла, на который указывает символическая ссылка. Выраже- 
ние ЕХРА должно возвращать путь к файлу, последний компонент которого пред- 
ставляет символическую ссылку. Если это не символическая ссылка или симво- 
лические ссылки не реализованы в файловой системе, или возникает какая-то 
системная ошибка, возвращается ипдет, и необходимо проверить код ошибки, на- 
ходящийся в переменной $!. 

Имейте в виду, что возвращаемая символическая ссылка может быть относитель- 
ной для указанного вами местоположения. К примеру, можно сказать: 


$1іпк_сопїепіѕ = геадііпк( “ /иѕг/1оса1/5гс/ехргеѕѕ/уоигѕе1ғ. Е") 
а геајііпк может вернуть: 


.. /ехргез$. 1. 23/іпс10џдеѕ/уоигѕе1#. һ 


что нельзя непосредственно использовать как имя файла, если только текущим 
каталогом не является /иѕг/іосаі/вгсјехргеѕз. 


геадріре 19 


ат 


геадртре ѕса1аг ЕХРВ 
геайріре 157 & (предложение) 


Внутренняя функция, реализующая конструкцию кавычек 0х// (также извест- 
ную как оператор обратных апострофов). Может пригодиться, когда потребуется 
задать выражение ЕХРА, которое сложно будет записать в виде строки в кавычках. 
Учтите, что в будущем мы можем поменять этот интерфейс с целью поддержки 
аргумента в виде списка, чтобы сделать функцию более похожей на ехес, поэтому 
не рассчитывайте, что она будет по-прежнему предоставлять скалярный кон- 
текст для ЕХРВ. Укажите эса1аг сами или попробуйте версию /157Т. Кто знает, мо- 
жет быть, когда вы это будете читать, она уже заработает. 
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гесу АЖ [1 


гесу $0СКЕТ, 5САЁАН, ГЕМ, ЕЁАб$ 


Извлекает сообщение из сокета. Пытается скопировать /ЕМСТН символов (кодов) 
в переменную 5САГАЯ из дескриптора файла 50СКЕТ. Возвращает адрес отправите- 
ля или ипде?, если возникла ошибка. СААР растет или сокращается в зависимо- 
сти от количества фактически прочитанных символов. Функция принимает та- 
кие же флаги, как геси(2) и в действительности реализована с использованием 
гесоѓгот(2). См. раздел «Сокеты» главы 15. 


Обратите внимание на слово «символов»: в зависимости от параметров настройки 
сокета, читаться будут либо байты (восьмибитные значения), либо полностью де- 
кодированные символы. По умолчанию все сокеты оперируют байтами. Но, на- 
пример, если сокет был настроен с помощью 01птоде на использование фильтра 
ввода/вывода :епсо01п9(и118), операции будут выполняться над символами Юни- 
кода в кодировке ОТЕ-8, а не над байтами. 


гедо 


гео [АВЕ 
гедо 


Оператор гедо выполняет переход в начало блока цикла без повторного вычисле- 
ния условного выражения. Блок сопііпие, если имеется, не выполняе:ся. Если 
метка [АВЕЕ опущена, оператор относится к самому внутреннему охватывающему 
циклу. Этот оператор обычно применяется в программах, которым надо «обма- 
нуть» себя в отношении только что введенных данных: 


# Цикл, объединяющий строчки с обратной косой чертой в конце 
мһі1е (<5ТрІМ) { 
і (5/\\\п$// &8& деғіпед($пехїЈіпе = <5Т0ІМ)) { 
$ .= $пехї1іпе; 
гедо; 
} 


ргіпё; # или что-нибудь еще... 
} 


Посредством гедо нельзя организовывать выход из блока, возвращающего значе- 
ние, например еуа1 {}, $00 {} или 40 {}, и его не следует применять для выхода из 
операции огер или пар. Если включен вывод предупреждений, Рей предупредит 
о применении гедо к циклу, находящемуся вне текущей лексической области ви- 
димости. 


Собственно блок семантически идентичен циклу, выполняемому один раз. По- 
этому гедо внутри такого блока превращает его в циклическую конструкцию. 
См. раздел «Управление циклом» главы 4. 


ге 15| 


ге? ЕХРЯ 
гег 


Оператор ге! возвращает истинное значение, если ЕХРА является ссылкой, и лож- 
ное в противном случае. Возвращаемое значение зависит от типа того, на что ука- 
зывает ссылка. Под встроенными типами понимаются следующие: 
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ЭСАЕАВ 
АВВАУ 
НАЅН 
СОрЕ 
ВЕР 
6108 
ІМАШЕ 
РОВМАТ 
то 
№ТВІМС 
Ведехр 


Возвращаемое значение ІМАЦЈЕ свидетельствует о том, что ссылка указывает на 
левостороннее выражение, не являющееся переменной. Подобные ссылки воз- 
вращают вызовы таких функций, как роѕ или ѕирѕіг. Значение УЗТНТМб возвраща- 
ется, если ссылка указывает на строку с номером версии. 


Значение Ведехр указывает, что аргумент является регулярным выражением, по- 
лученным с помощью дг//. 


Если предмет ссылки «освящен» в пакет, возвращается имя этого пакета. Опера- 
тор ге? можно интерпретировать как оператор «Ёуреоѓ». 


1 (ге?($г) ед “НАЗН”) { 
зау г является ссылкой на хеџ. ° 

} 

е1$1Е (геғ(%г) ед “Нитр”) { # Нехорошо - см. ниже 
ѕау “г является ссылкой на объект Нитр “; 


} 
е151? (пої ге! $г) { 
зау “г вообще не является ссылкой. " 


} 


В ООП считается плохим стилем проверять класс объекта на равенство какому- 
либо конкретному имени, поскольку производный класс имеет другое имя, но 
ему разрешен доступ к методам базового класса, согласно принципу подстановки 
Барбары Лисков (ГазКоу Ѕирѕііфџііоп Решеше, І5Р). Лучше использовать метод 
15а класса ИМТУЕНЗА|, как показано ниже: 


і ($г->1за(“Нипр”) } 
ѕау “г является ссылкой на объект Нитр или подкласс. 


} 


Лучше всего совсем не выполнять проверку, поскольку механизм объектов вооб- 

ще не отдаст вашему методу объект, не убедившись, что это допустимо. Дополни- 

тельные подробности читайте в главах 8 и 12. См. также функцию геѓїіуре в раз- 

деле с описанием аіїгібиїеѕ в главе 29. 

гепате Е т 
гепате ОЕОМАМЕ, МЕИМАМЕ 


Изменяет имя файла. Возвращает истинное значение в случае успеха и ложное 
в противном случае. Данная функция обычно не переходит границы файловых 
систем, хотя в системе О№МХ это иногда можно компенсировать командой то. Если 
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файл МЕИМАМЕ уже существует, он уничтожается. В системах, отличных от ОМІХ, 
могут существовать дополнительные ограничения. 


Реализовать переименование файлов с перемещением между различными файло- 
выми системами можно с помощью платформо-независимой функции поуе из 
стандартного модуля Гі1е::Сору. 


гедите [1 @] т 


геди1ге МЕЯЅТОМ 
гедиіге ЕХРЯ 
гедаиіге 


Устанавливает зависимость какого-либо рода от своего аргумента. 


Если аргумент является строкой, гедиіге загружает и выполняет код Регі, нахо- 
дящийся в отдельном файле, имя которого задано строкой. Это похоже на выпол- 
нение файла посредством 00, за исключением того, что геди1ге проверяет, загру- 
жен ли уже библиотечный файл, и возбуждает исключение при возникновении 
трудностей. (Поэтому ее можно использовать для выражения зависимостей меж- 
ду файлами, не беспокоясь о возможности повторной компиляции.) Как и родст- 
венные бо и изе, гедиіге умеет выполнять поиск подключаемых файлов в маршру- 
тах, хранимых в массиве @ТКС, и обновлять ХІМ в случае успеха. См. главу 25. 


Файл должен возвращать истинное значение в качестве последнего значения, что- 
бы сообщить об успешном выполнении кода инициализации, поэтому такие фай- 
лы принято заканчивать символами 1;, если только вы не уверены, что он в любом 
случае возвращает истинное значение. (Это требование может быть ослаблено 
в будущем.) 

Если аргументом геди1ге является номер версии вида у5.6.2, гецизге требует, что- 
бы выполняющаяся в данный момент версия Реп была не ниже указанной. (Рег: 
также принимает числа с плавающей запятой, такие как 5.005 08, для совмес- 
тимости с более старыми версиями Рег], но использование такого формата не 
поощряется в данное время, поскольку он не понятен людям из других культур.) 
Поэтому сценарий, которому требуется Ре] версии 5.14, может иметь первой 
строкой: 


геди1ге 5.014_001, # предпочтительнее для обратной совместимости 
геди1ге 5.14.1; # то же самое 
геди1ге м5. 14. 1; # проверка версии во время выполнения 


и более ранние версии Ре! прервут свою работу. Однако, как и все другие зависи- 
мости, эта проверяется на этапе выполнения. Для проверки во время компиля- 
ции можно сказать изе 5.14.0. См. также описание $РЕВІ МЕВЅІ0№ в главе 25. 


Если аргументом гедиіге является голое имя пакета (см. раскаде), функция авто- 
матически предполагает наличие суффикса ‚рт, что облегчает загрузку стан- 
дартных модулей. Такое поведение похоже на изе, за исключением того, что про- 
исходит это на этапе выполнения, а не на этапе компиляции, и не вызывается 
метод іпрогї. Например, чтобы загрузить ЗосЁе{.рт, не вводя символы в текущий 
пакет, скажите так: 


гедитге Зоскет; # вместо “изе Зоскет; " 
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Однако такого же результата можно добиться следующим кодом, который допол- 
нительно выводит предупреждение на этапе компиляции, если 80оскеі.рт не уда- 
ется найти: 


изе Зоскет (), 


Применение гедиіге с голым именем также заменяет все `` в имени пакета на сис- 
темный разделитель каталогов, обычно УА Иными словами, если сказать: 


гедиіге Роо: : Ваг: # прекрасное голое имя 


функция гедиіге попытается найти файл Роо/Ваг.рт в каталогах, перечисленных 
в массиве @Т№С. Но если попробовать так: 


$С1а$$ = "Боџо::Ваг" 


гедиіге $с1азз; н $с1а55 не голое имя 
или так: 
гедиіге "Еоо: :Ваг”; # литерал в кавычках - не голое имя 


гедиіге будет искать файл Роо::Ваг в каталогах, перечисленных в массиве @1МС, 
и будет жаловаться, если не сможет его там найти. В этом случае можно сделать 
так: 


е\уа1 "геди1ге $с1а55" 


Теперь, когда понятно, как геди1ге ищет файлы, получив голое слово Е виде аргу- 
мента, рассмотрим некоторые дополнительные особенности, скрытые от посто- 
роннего взгляда. Перед тем, как приступить к поиску файла с расширением .рт, 
функция гедиіге сначала попытается найти файл с тем же именем, но с расшире- 
нием .ртс. Если такой файл обнаружится, он загружается вместо файла с расши- 
рением .рт. 


Массив @1№С содержит список скаляров, определяющих порядок загрузки моду- 
ля. Функция гедиіге перебирает элементы этого списка, пока не найдет скаляр- 
ный элемент, ведущий к загружаемому исходному коду, и затем загружает этот 
код. 

Каждый элемент в @1\№С должен быть либо строкой (которая интерпретируется 
как путь к каталогу, где может находиться искомый файл), либо своеобразной 
«программной сущностью» (используемой для генерации содержимого требуемо: 
го файла). 

Такой «программной сущностью» может быть ссылка на подпрограмму, массив 
со ссылкой на подпрограмму (плюс дополнительные аргументы для подпрограм- 
мы) или объект с методом ІМ. Встретив такую «программную сущность», геди1ге 
вызывает ее и передает два аргумента: саму сущность и файл, который требуется 
отыскать. То есть: 


Ссылка на подпрограмму: $ѕир ге?->($и0_геғ, Фгедџігед_#ғ11е) 
Массив со ссылкой на подпрограмму: Фагг_геѓ->[0]->($агг_ге?, $гедиігед #і1е) 
Объект: Фобјесі->ІМС($гедиігед_?і1е) 


Какая бы форма ни была вызвана, подпрограмма или метод, ожидается, что она 
вернет список, содержащий до трех значений, которые интерпретируются, как 
описано в табл. 27.4. 
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Таблица 27.4. Возвращаемые значения, ожидаемые от ссылок на программный код 
в @ГМС 


Аргументы 
(НАМІ Е) 
(НАМОГЕ, СОБЕВЕР) 


Действие 


Читает исходный код из дескриптора файла НАМІ Е 


Читает исходный код из дескриптора файла НАМІ Е и фильт- 
рует через подпрограмму 


(НАМОГЕ, СОРЕВЕЕ, ВЕР) 
(ипде?, СОРЕВЕР) 


Как и выше, но передает подпрограмме ВЕЕ 


Многократно вызывает подпрограмму, возвращающую стро- 
ки с исходным кодом 


(ипдеЁ, СОРЕВЕЕ, ВЕР) 
Любая другая комбинация | Вызывает ошибку и переход к другому элементу в @1М№С 


Как и выше, но передает подпрограмме ВЕР 


Аналогичные обработчики можно также устанавливать в элементы %1№С, соответ- 
ствующие загруженным файлам. См. описание переменной 1\0 в главе 25. 


См. также до ЁЛЕ, команду иѕе, прагму 11р и стандартный модуль ЕлпдВ1п. 


геѕеї 


геѕеї ЕХРВ 
геѕеї 


Эту функцию обычно употребляют (или злоупотребляют ею) в начале цикла или 
в блоке сопііпџе в конце цикла с целью очистить глобальные переменные или 
сбросить скомпилированные операторы поиска п?? в исходное состояние, чтобы 
их снова можно было использовать. Выражение ЕХРА интерпретируется как спи: 
сок отдельных символов (дефисы могут использоваться для определения диапа- 
зонов). Все скалярные переменные, массивы и хеши, начинающиеся с одной из 
указанных букв, устанавливаются в свое первоначальное состояние. Если выра- 
жение опущено, производится сброс операторов однократного поиска соответст- 
вия (п?РАТТЕР№?), после чего сопоставление может выполняться снова. Сбрасыва- 
ются только перемененные и операторы поиска в текущем пакете. Всегда возвра- 
щает истинное значение. 


Чтобы сбросить все переменные с именами, начинающимися символом “Х”, мож- 
но сказать: 


гезет “Х”; 
А чтобы сбросить все переменные с именами в нижнем регистре, можно сказать: 
гезет "а-2"; 
Наконец, чтобы сбросить все скомпилированные операторы поиска 77, можно 
сказать: 
гезет; 
Сброс “А-7" в пакете паіп делать не рекомендуется, поскольку при этом будут очи- 
щены глобальные массивы и хеши АВС\, ІМС, ЕМ и 516. 


Лексические переменные, создаваемые при помощи пу, этой функцией не затра- 
гиваются. Применять геѕеї обычно не рекомендуется, поскольку легко можно 
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очистить целое пространство имен, и потому что использовать оператор ?? тоже 
не рекомендуется. 


См. также функцию йе1еїе раскаде из стандартного модуля 5упро1 и описание про- 
блемы в целом в разделе «Защищенные разделы» главы 20. 


геќигп 


геъџгп ЕХРВ 
геїигп 


Этот оператор заставляет текущую подпрограмму, еуа1 или йо ЕИЕ немедленно вер- 
нуть заданное значение. Попытка использовать геїџгп вне трех указанных мест 
влечет за собой исключение. Обратите также внимание, что еуа] не может выпол- 
нять геїши от имени подпрограммы, которая вызвала е\а1. 


Выражение ЕХРП может вычисляться в списочном, скалярном или пустом контек- 
сте – в зависимости от того, как будет использоваться возвращаемое значение, 
причем контекст может изменяться от вызова к вызову. Это значит, что переда- 
ваемое выражение будет вычисляться в контексте вызова подпрограммы. Если 
подпрограмма вызывается в скалярном контексте, ЕХРЯ вычисляется в скаляр- 
ном контексте. Если подпрограмма вызывается в списочном контексте, ЕХРЯ вы- 
числяется в списочном контексте и может возвращать список. гетигп без аргумен- 
тов возвращает скалярное значение ипіеї в скалярном контексте, пустой список 
() в списочном контексте и (естественно) вообще ничего в пустом контексте. Кон- 
текст вызова подпрограммы можно определить, находясь внутри подпрограммы, 
с помощью (неудачно названной) функции маптаггау. 


гемегѕе 
геуегѕе 4157 


В списочном контексте возвращает список, состоящий из элементов { 157, распо- 
ложенных в обратном порядке. Эту функцию можно использовать для создания 
убывающих последовательностей: 


Ғог (геуегѕе 1 10) { } 


Поскольку при передаче в списочном контексте хеши превращаются в плоские 
списки, геуегзе можно также применять для инвертирования хеша, если допус- 
тить, что все значения в нем уникальны: 


У\рагРгоо = геуегље %Фообаг; 


В скалярном контексте геуегзе объединит все элементы / 157 в одну строку и вер- 
нет ее, расположив символы в обратном порядке. Под символами здесь понима- 
ются коды, а не графемы. Это означает, что при неумелом обращении геуегзе спо- 
собна превратить все последовательности "\г\п” в “\п\7”, а также вызвать переста- 
новку комбинационных символов, отнеся их не к тому базовому символу. Для 
перестановки графем вместо кодов символов выполните следующее: 


фсодеџпі = јоіп “” => геуегѕе Фип1соде =- /\Х/а; 
Небольшой совет: обращение списка, отсортированного пользовательской функ- 


цией, часто можно упростить, если сразу отсортировать этот список в обратном 
направлении. 
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геміпааїг | $ РЕТ 
гем1п091г ОТАНАМОЕЕ 


Устанавливает текущую позицию для подпрограммы геа091г в ОТАНАМОЕ на нача- 
ло каталога. Эта функция может иметься не во всех системах, поддерживающих 
геай01іг, и вызов геміпідіг завершается ошибкой, если в системе она не реализова- 
на. Возвращает истинное значение в случае успеха и ложное в противном случае. 


ппаех 


гіпдех 578, 8/85ТА, РОЅІТІОМ 
гіпдех 5789, 5/85ТВ 


Работает так же, как іпіех, но возвращает позицию последнего вхождения 51/8578 
в 571 (в противоположность іпіех). Возвращает -1, если 5/8578 не найдена. Аргу- 
мент РОЅІТІОМ, если задан, представляет собой самую правую позицию, которую 
можно вернуть. Выполнить обход строки в обратном направлении можно так: 


$роз = 1епдїһ $$1г1пд; 

пе (($роз = гіпаех Фѕ1гіпд, $100КРог, $роз) >= 0) { 
зау "Найдена в $роз"; 
$роз--; 

} 


Обратите внимание, что, подобно 1пдех, функция г1піех оперирует позициями 
символов (кодами), а не позициями графем. Если потребуется интерпретировать 
строку, как последовательность графем, используйте методы 1пдех, г1пдех и роз из 
модуля Џпісоде::005їгіпс̧, доступного в СРАМ. 


Чг га 
е ТЕ 
гтай [5_ ат | 
гтдіг ЕТГЕМАМЕ 
гтдіг 


Удаляет каталог, указанный в ЁГ ЕЛАМЕ, если он пустой. В случае успеха возвра- 
щает истинное значение, в противном случае ложное. См. также модуль Ғі1е: :Раїћ, 
если вам нужно сначала удалить содержимое каталога и по какой-то причине не- 
желательно выходить в интерпретатор команд и вызвать гт -г. (Например, у вас 
может не быть интерпретатора или команды гт.) 


5/// Ш 
$/// 


Оператор подстановки. См. раздел «Операторы поиска по шаблону» главы 5. 


ау ТЯ [а 


зау ЕТЕЕНАМОЕЕ 1 15Т 
зау ЕТЕЕНАМОЕЕ 

ѕау Ё15Т 

зау 


Функции Рей в алфавитном порядке 875 


Действует так же, как функция ргіпї, но неявно добавляет перевод строки в кон- 
це. ѕау [157 - это более краткая форма записи { 10са1 $\ = “\п”; ргіпі /157 }. При 
вызове функции с ЕН ЕНАМЕЕ без списка [15Т выведет содержимое $_ в заданный 
дескриптор файла, который должен быть действительным дескриптором файла, 
таким как ЕН, а не косвенным, как $11. 


Это ключевое слово доступно, только когда включена особенность `$ау”; см. раз- 
дел «Термы и списочные операторы (влево)» в главе 3. 


ѕсаіаг 
зса1аг ЁХРВ 


Эту псевдофункцию можно использовать внутри / 157, чтобы обеспечить принуди- 
тельное вычисление ЕХРП в скалярном контексте, если вычисление в списочном 
контексте приводит к другому результату. Например: 


пу ($пехтуаг) = ѕса1аг <5Т0ІМ№; 


не позволяет оператору <5Т01№ прочесть все строки из стандартного ввода перед 
присваиванием, поскольку присваивание списку (даже объявленному с помо- 
щью пу) создает списочный контекст. (В данном примере без ѕсајаг первая строч- 
ка из <5ТрІ№ все же была бы присвоена переменной $пехіуаг, но последующие 
строчки были бы прочтены и отброшены, поскольку список, которому осуществ- 
ляется присваивание, может получить только одно скалярное значение.) 


Конечно, проще и короче было бы простс отбросить круглые скобки, изменив тем 
самым списочный контекст на скалярный: 

пу $пехімаг = <5Т0ІМ; 
Поскольку функция ѕау является списочным оператором, необходимо сказать: 


зау "Гепоїћ 1$ “, зса1аг(@АВВАХ); 


чтобы вывести длину массива @АВВАУ. 


Не существует функции 1131, соответствующей ѕса1аг, поскольку на практике ни- 
когда не требуется принудительно осуществлять вычисление в списочном кон- 
тексте. Это связано с тем, что любая операция, где нужен /15Т, уже бесплатно пре- 
доставляет списочный контекст для своих списочных аргументов. 


Поскольку ѕса1аг является унарным оператором, если по ошибке заключить ЕХРА 
в круглые скобки, он будет вести себя как скалярное выражение запятой, вычис- 
ляя все элементы, кроме последнего, в пустом контексте и возвращая последний 
элемент, вычисленный в скалярном контексте. Такое поведение редко бывает же- 
лаемым. Следующая инструкция: 


ргіпі ис(зса1аг(&Роо, $0аг)), $баг; 
(а)морально эквивалентна таким двум: 


&тоо; 
ргіпі(ис($Ббаг), $бах), 


Оператор запятой мы описывали в главе 2. Дополнительно об унарных операто- 
рах читайте в разделе «Прототипы» главы 7. 
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а Х) 
ѕеек 9" ПАВб 
ѕвек ЕПЕНАМОЕЕ, ОРЕЗЕТ, ИНЕМСЕ 


Устанавливает позицию в файле для ЕПЕНАМИЕ, точно так же, как вызов {зееЁ(З) 
для стандартного ввода/вывода. Первая позиция в файле имеет смещение 0, а не 1. 
Кроме того, смещения относятся к позициям байтов, а не символов или строк. В це- 
лом, поскольку строки имеют различную длину, невозможно обратиться к строке 
с конкретным номером, не просмотрев весь файл до этой точки, если только не 
известно, что все строки имеют определенную длину, или не построен индекс, 
транслирующий номера строк в байтовые смещения. (Те же ограничения касают- 
ся позиций символов в файлах с переменной длиной кодировки символов: опера- 
ционная система не знает, что такое символы, она понимает только байты.) 


ЕТЕЕНАМОЕЕ может быть выражением, возвращающим имя фактического дескрип- 
тора файла, переменную Ёурев1оЬ или ссылку на нечто, напоминающее объект 
дескриптора файла. Возвращает истинное значение в случае успеха и ложное 
в противном случае. Для удобства может рассчитывать смещения от различных 
позиций в файле. Значение ИНЕМСЕ задает позицию в файле, используемую в каче- 
стве отправной точки для откладывания смещения ОРЕЅЕТ: 0 – начало файла; 1 - 
текущая позиция в файле или 2 — конец файла. Значение ОРЕСЕТ может быть отри- 
цательным при ИНЕМСЕ, равном 1 или 2. Если потребуется использовать для ИНЕМСЕ 
символические значения, можно воспользоваться константами 5ЕЕК_ЗЕТ, ЗЕЕК_СИВ 
и ЅЕЕК_ЕМ№ из модуля 10::5еекаб1е, РО$ІХ или Есп1{1. 


Если понадобится установить позицию в файле для ѕуѕгеай или зузигЦе, не при- 
меняйте еек; буферизация стандартного ввода/вывода делает результат ее дей- 
ствия на позицию в файле непредсказуемым и непереносимым. Используйте 
зуззеек. 


Из-за правил и строгостей АМЗГ С в некоторых системах нужно выполнять зеек 
при каждом переключении между чтением и записью. Кроме того, при этом может 
вызываться функция библиотеки стандартного ввода/вывода сіеагегг (3). Чтобы 
избежать смещения позиции в файле, можно задать ИНЕМСЕ равным 1 (ЅЕЕК_СЏВ) 
и ОҒБЅЕТ равным 0: 


зеек(ТЕЗТ, 0, 1); 


Одно интересное применение этой функции дает возможность обрабатывать рас- 
тущие файлы, например: 


Рог (;;) { 
мһі1е (<106>) { 


9гок($_); # Обработать текущую строку. 
} 
51еер 15; 
зеек 106, 0, 1; # Сбросить ошибку конца файла. 


} 


Последний вызов зеек сбрасывает ошибку конца файла, не перемещая текущую 
позицию в файле. В зависимости от того, насколько стандартной окажется реа- 
лизация ввода/вывода в конкретной библиотеке С, может понадобиться что-то 
еще, например: 


Рог (;;) { 
Рог ($сигроз = +е11 ЕЕ; <ҒІГЕ>; $сигроѕ = їе11 ЕЕ) { 
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9гок($_); # Обработать текущую строку. 
} 
ѕ1еер $Рог_а_м!!11е; 
зеек ЕЦЕ, $сигроз, 0; # Сбросить ошибку конца файла. 
} 


Аналогичная стратегия может применяться для запоминания ѕеек-адреса каж- 
дой строки в массиве. 


Внимание: аргумент РОЗТТ1ОМ определяет значение позиции в байтах, а не в симво- 
лах, независимо от того, задействован ли в дескрипторе файла какой-либо фильтр 
ввода/вывода для декодирования. Однако все функции в Рен, выполняющие чте- 
ние файлов, используют тот или иной фильтр кодирования/декодирования, и по- 
тому есть вероятность прочитать часть «символа» и получить недопустимую стро- 
ку. Старайтесь не смешивать вызовы ѕуѕѕеек и зеек с функциями ввода/выво- 
да при работе с дескрипторами файлов, предусматривающими обработку много- 
байтных кодировок. 


ѕееКаіг ТАА 
ѕеекаіг ОТАНАМОЕЕ, Р0$ 


Устанавливает текущую позицию для следующего обращения к геаддіг в ОТАНАМ- 
1Е. В аргументе Р05 должно передаваться значение, возвращаемое {е1101г. Для 
этой функции действуют те же предостережения относительно возможного сжа- 
тия каталога, как и для соответствующей подпрограммы системной библиотеки. 
Функция может быть реализована не везде, где есть геадд1г. Она наверняка не 
реализована там, где нет геаййіг. 


ѕеіесі (дескриптор выходного файла) АЯ 


ѕе1есї ЕТІ ЕНАМІЕ 
ѕе1есї 


В силу исторических причин есть два оператора ѕе1ест, совершенно не связанных 
друг с другом. О втором рассказывается в следующем разделе. Данная версия опе- 
ратора 5616есі возвращает выбранный в настоящее время дескриптор выходного 
файла и, если задан ЕІ ЕНАМ№ІЕ, устанавливает текущий дескриптор файла для вы- 
вода. Это влечет два результата: во-первых, нгіїе или ргіпї без дескриптора файла 
по умолчанию осуществляют вывод в этот РІ ЕНАЛМІЕ. Во-вторых, специальные пе 
ременные, связанные с выводом, будут ссылаться на этот дескриптор выходного 
файла. Например, если потребуется установить одинаковый формат верхнего ко- 
лонтитула сразу для нескольких дескрипторов вывода, можно поступить так: 


зе1есф ВЕРОНТТ; 


$" = "МУТор"; 
ѕе1ес+ ВЕРОНТ2: 
$7 = "МуТор”; 


Но обратите внимание, что при этом АЕРОВТ2 остается текущим выбранным де- 
скриптором файла. Такое поведение можно рассматривать как антисоциальное, 
поскольку оно способно повлиять на работу функций ргіпї или игЦе в других под- 
программах. Правильно написанные библиотечные подпрограммы оставляют на 
выходе текущий дескриптор файла таким же, каким он был на входе. Чтобы под- 
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держивать такой режим, РЛ ЕНАМІЕ можно сделать выражением, возвращающим 
имя фактического дескриитора файла. Сохранять и восстанавливать текущий 
выбранный дескриптор файла можно таким образом: 


ту $01971 = ѕе1есі 5ТОЕВВ; 
$1 = 1; 
ѕе1есі $о1ағһ, 


или идиоматически, но несколько менее прозрачно: 
ѕе1есї((ѕе1есі (ЅТОЕВВ), $! = 1)[0]) 


Этот пример создает список из значений, возвращаемых вызовом ѕе1есі(ЅТрЕВВ) 
(который в качестве побочного эффекта выбирает ЭТОЕВВ), и $| = 1 (что всегда да- 
ет 1), но устанавливает автоматическую очистку буфера для назначаемого теку- 
щим дескриптором ТРЕВА в качестве побочного эффекта. Первый элемент списка 
(прежний выбранный дескриптор файла) используется теперь в качестве аргу- 
мента для внешнего оператора ѕе]есі. Причудливо, а? Вот что получается, когда 
твои знания Шзр делают тебя опасным человеком. 


Можно также использовать стандартный модуль 5е1есіЅамег, чтобы автоматиче- 
ски восстанавливать прежний ѕе1есї после выхода из области видимости. 


Однако после всего сказанного следует заметить, что в наше время редко требует- 
ся применять такую разновидность ѕе1есї, ведь для большинства специальных 
переменных, которые может потребоваться установить, существуют объектно- 
ориентированные методы-обертки, которые сделают это автоматически. Поэтому 
вместо непосредственного присваивания $| можно сказать: 


изе 10: : Напд1е; # К сожалению, это »*не* маленький модуль. 
5ТОООТ->аитоғ1иѕћ( 1); 


А предыдущий пример форматирования можно записать так: 


иѕе ТО: :Напд1е; 
ВЕРОВТ1->Рогта{_Тор_пате( "МуТор" ); 
ВЕРОВТ2->Гогта{_Тор_пате(“МуТор”); 


зе!есЕ (готовые дескрипторы файлов) Г я! 
зеЛесе АВІТЅ, ИВІТЅ, ЕВІТЅ, ТІМЕОШТ 


Оператор ѕе1ест с четырьмя аргументами совершенно не связан с описанным вы- 
ше оператором ѕе1есї. Этот оператор используется, чтобы определить дескрипто- 
ры файлов, готовые для ввода или вывода, или чтобы сообщить о наличии исклю- 
чительной ситуации. (Благодаря этому можно избежать необходимости прово: 
дить опрос.) Этот оператор обращается к системному вызову ѕеіесі2) с указанны: 
ми битовыми масками, которые можно создать с помощью Ѓі1епо и уес, например: 


фгіп = $міп = $ейт = "”; 
мес(фгіп, #і1епо(9$ТрІМ), 1) = 1; 
уес($и1п, Ғі1епо(5ТрО0Т), 1) = 1; 
феіп = $гіп | $; 


Чтобы выполнить 501есї для нескольких дескрипторов файлов, можно написать 
такую подпрограмму: 
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ѕир ?һріїв { 
ту ©Ғһ1157 = Ө ; 
пу $6163; 
Ғог ту $#һ (@Ғһ1191) { 
мес($Ы11$, Ғі1епо($#һ), 1) = 1 
} 
гетигп $0115; 
} 
Фгіп = Ғһ01і5(*5ТрІМ, *ТТҮ, »МУ$ОСК); 


Обратите внимание, что здесь дескрипторы файлов передаются функции в виде 
ссылок на их їуреғ1орѕ, потому что передача их в виде строк – не самое лучшее ре- 
шение. Если вы собираетесь использовать «самооживляемые» дескрипторы фай- 
лов, не делайте этого. 


Для повтоного использования битовых масок (а это более эффективно) обычно ис- 
пользуется идиома: 


(ФпҒоипд, $тіте1еѓї) = 
ѕеесї($гооџї=фгіп, $моцт=$илп, $еоит=Фе1п, $1теоџї); 


Или осуществляется блокировка, пока не станет доступен какой-нибудь дескрип- 
тор файла: 


$пғоипа = ѕе1есї($гоџі=$гіп, Фмоиї=$иіп, $еоиё=$еіп, ипде#); 


Как видите, вызов ѕе1есї в скалярном контексте просто возвращает $пѓоџпа — чис- 
ло готовых дескрипторов. 


Значением присваивания $м0и1=Фи1т является его левая часть, поэтому сначала 
$иоиї получает новое значение, а затем вызывается 561есї, в то время как $м1п ос- 
тается неизменной. 


В любых аргументах можно передать ипіеѓ, и тогда они игнорируются. Значение 
ТТМЕОЙТ, если оно не равно ипде?, выражается в секундах и может быть дробным. 
(Равный 0 интервал ожидания ТТМЕОЙТ действует как опрос.) Далеко не все реали- 
зации способны возвращать $їіпеіеѓї. Неспособные на это возвращают значение 
$тіпе1еѓї, равное переданному $їітеоиї. 


Стандартный модуль 10::5е1есї предоставляет более дружественный интерфейс 
к 5е1есї, в основном благодаря тому, что берет на себя всю работу по созданию би- 
товой маски. 


Одно из применений $01есї состоит в создании пауз большего разрешения, чем 
позволяет ѕ1еер. Следует указать ипде{ для всех битовых масок. Чтобы приостано- 
вить выполнение на (по крайней мере) 4,75 секунды используйте: 


ѕе1есі ипаеЁ, ипдеғ, ипде?, 4.75; 


(В некоторых системах, отличных от ОМГХ, тройной ипаег может не работать, 
и тогда потребуется подделать по крайней мере одну битовую маску действующе- 
го дескриптора, который никогда не будет готов.) 


В настоящее время предпочтительнее импортировать специальную версию $1еер 
из стандартного модуля Тіпе::Ніћеѕ, обеспечивающего более высокую переноси- 
мость: 


узе Тіте: :НіВеѕ дм(ѕ1еер); 
ѕ1еер 4.75; # не обычный ѕ1еер 
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Вряд ли следует смешивать буферизованный ввод/вывод (как в случае геад или 
<НАМОЕЕ>) и ѕе1есї, кроме случаев, разрешенных РОЅІХ, и даже в этом случае толь- 
ко на подлинных системах РОЅІХ. Применяйте вместо этого зузгеад. 


ѕетсі ЯН 


ѕетсї1 ЈО, ЅЕММЫМ, СМО, ААС 


Вызывает функцию Ѕуѕіет У ІРС ѕетсі[(2). Возможно, придется сначала сказать 
иѕе ТРС::5уз\, чтобы получить определения констант. Если СМ имеет значение ТРС_ 
ЭТАТ или СЕТАЦ, аргумент АВб должен быть переменной, содержащей возвращае- 
мую структуру ѕепій 05 или массив значений семафоров. Подобно іосї] и ѓспї1, 
возвращает ипдеЁ в случае ошибки, '0 Бит тгие” обозначает ноль и фактическое 
значение в противном случае. 


См. также модуль ІРС::Ѕетарћоге. Данная функция доступна только в системах, 
поддерживающих Ѕуѕіет У ІРС. 


У 1 
ѕетдеї ЕТЕ 
зетдее КЕУ. М№ЕМЅ ЕІАбЅ 
Обращается к системному вызову Зуѕќет У ІРС зетаец2). Перед вызовом следует 


выполнить изе ІРС::5у5У, чтобы получить определения констант. Возвращает иден- 
тификатор семафора или ипдеѓ в случае ошибки. 


См. также модуль ІРС::Ѕетарћоге. Данная функция доступна только в системах, 
поддерживающих буѕёет У ІРС. 


ѕетор ЕЛЕ 
ѕетор КЕҮ, ОРУТАТМС 


Обращается к системному вызову Ѕуѕтет У ІРС ѕетор(2), чтобы выполнить такие 
операции с семафорами, как передача сигналов и ожидание. Перед вызовом сле- 
дует выполнить иѕе ІРС::5у5У, чтобы получить определения констант. 


Аргумент ОРСТР1\б должен быть упакованным массивом структур ѕепор. Структу- 
ру зепор можно создать вызовом раск(”5* $ѕетпит $ѕетор, $ѕепё1ад). Число опе- 
раций с семафорами определяется длиной 0ОР5ТА1М6. Функция возвращает истин- 
ное значение в случае успеха и ложное, если возникла ошибка. 


Следующий код ожидает на семафоре $ѕеппит с идентификатором в $5ет10: 


$ѕетор = раск "ѕ«", $ѕетпит, -1, 0; 
ѕетор(Фѕетіа, $зетор} Н 91е "Ѕетарһоге їгоџр1е: $!" 


Для передачи сигнала семафору просто замените -1 на 1. 


См. раздел «Зузет У ІРС» главы 15. См. также модуль 1РС::Ѕетарћоге. Данная функ- 
ция доступна только в системах, поддерживающих Ѕуѕіет У ІРС. 


5епа Я ПАМ ] х 


ѕепа $0СКЕТ, М0, ҒІА65, ТО 
ѕепд ЅОСКЕТ, М0, ҒІАб5 
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Посылает сообщение в сокет. Принимает те же флаги, что и одноименный систем- 
ный вызов, — см. ѕеп(2). Для несоединенных сокетов нужно указать адрес от- 
правки 70, что заставляет функцию Ре!| зепа работать как зеп ю(2). Системный 
вызов зепатзЕ(2) в настоящее время не реализован в стандартном Регі. Функция 
ѕепа возвращает число отправленных символов или ипіе?, если возникла ошибка. 


Обратите внимание на слово «символов»: в зависимости от параметров настройки 
сокета, отправляться будут либо байты (восьмибитные значения), либо символы. 
По умолчанию все сокеты оперируют байтами. Но, например, если сокет был на- 
строен с помощью 61пподе на использование фильтра ввода/вывода :епсойіпо(иї#8), 
операции будут выполняться над символами Юникода в кодировке ОТЕ-8, а не 
над байтами. 


(Некоторые системы, отличные от ОМХ, неверно рассматривают сокеты как от- 
личные от обычных дескрипторов файлов, в результате чего всегда приходится 
использовать для сокетов зепд и гесу вместо более удобных операторов стандарт- 
ного ввода/вывода.) 


Ошибка, которую часто совершает как минимум один из нас, состоит в том, что 
путаются ѕепа Рег1 и ѕепо С в записи: 


ѕепа 50СК, $0иғғ#ег, 1епоїћ Фри Рег # НЕВЕРНО 


Этот код непонятным образом приводит к ошибке в зависимости от связи между 
длиной строки и битами ГІ А65, которые ожидает система. Примеры см. в разделе 
«Передача сообщений» главы 15. 


УрО ТИ 
зетрагр РТО, РОЕР 


Устанавливает текущую группу процессов (РСЕР) для процесса с указанным РЮО 
(для текущего процесса используйте РТО, равный 0). Вызов ѕеїрдгр возбудит ис- 
ключение при вызове в системе, не поддерживающей зеёрагр(2). Будьте осторож- 
ны: некоторые системы игнорируют передаваемые аргументы и всегда выполня- 
ют ѕеїрогр(0, $$). К счастью, именно эти аргументы обычно и требуется передать. 
Если аргументы опущены, по умолчанию они равны 0,0. В операционной системе 
ВЗР версии 4.2 функция зе{рогр не принимала никаких аргументов, но в ВР 4.4 
это синоним для функции $61р919. Для лучшей переносимости (согласно некото- 
рому ее определению) используйте функцию ѕеїрдій из модуля РОЗ1Х непосредст- 
венно. Если в действительности вы пытаетесь превратить свой сценарий в про- 
грамму-демон, стоит подумать также о применении функции РО$1Х::3е1$19. Обра- 
тите внимание, что РОЅІХ-версия ѕеїрдгр не принимает аргументы, поэтому толь- 
ко ѕеїрдгр(0,0) является действительно переносимой. 
т ұу 


РЕ ХИХ 
ѕеїрпогіу Я тии! 
ѕеїргіогіїу ИНТСН, ИНО, РЕТОВІТҮ 


Устанавливает текущий приоритет РАТОРТТУ для процесса, группы процессов или 
пользователя в соответствии с ИНТСН и ИНО. См. зе ртюгии(2). Возбуждает исключе- 
ние при вызове в системе, не поддерживающей зертогиу(2). Чтобы понизить 
приоритет процесса на четыре единицы (как при запуске программы с пісе(1)), 
сделайте так: 
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ѕеїргіогіїу 0 0, оеїргіогіїу(0, 0) + 4; 


В разных системах значение приоритета может интерпретироваться по-разному. 
Некоторые приоритеты могут быть недоступны для непривилегированных поль- 
зователей. 


См. также модуль В50::Веѕоџгсе в СРАМ. 


| хук. 
ѕеїѕоскорї 5! авв 0. | 
ѕеіѕоскорїі Ѕ0СКЕТ, 1 ЕУЕІ, ОРТМАМЕ, ОРТУАЕ 


Устанавливает параметры сокета. Возвращает ипде! при ошибке. Все константы, 
необходимые для передачи в аргументах [ЕУЕЁ и ОРТМАМЕ, определены в модуле 
Ѕоскеї. Значения для аргумента /ЕУЕЁ можно также получить с помощью функции 
Оеїргоїобупапе. [Е\ЕЁ указывает, на какой уровень протокола нацелен вызов, или 
501 _З0СКЕТ — для самого сокета поверх всех уровней. Значением аргумента ОРТУАЕ 
может быть либо упакованная строка, либо целое число. Целочисленное значе- 
ние ОРТУАЕ является более короткой формой записи раск(”1", ОРГУА!). ОРТУАЕ можно 
задать как ипдеГ, если вы не хотите передавать аргумент. 


Часто для сокета устанавливается параметр 50_НЕЦЗЕАООВ, чтобы обойти пробле- 
му, возникающую при невозможности привязаться к конкретному адресу, когда 
предыдущее соединение ТСР на этом порту все еще принимает решение о закры- 
тии. Это выглядит так: 


изе Ѕоскеї; 
ѕоскеї($0СК, ...) || діе “Невозможно создать сокет: $!\п” 
ѕеїѕоскорі (50СК, $01_50СКЕТ, 50 ВЕЦЅЕАРрА, 1) 

|| магп “Невозможно выполнить ѕеїѕоскорт: $!\п” 


Другим типичным параметром является запрет использования алгоритма Ней- 
гла (Маё1е): 


ие боскет ам(ІРРВОТО ТСР ТСР МОрЕГАҮ), 
ѕеїѕоскорї( $ѕоскеї, ІРРВОТО ТСР, ТСР_М№ОВЕГАҮ, 1); 


См. в ѕзеѓѕзоскор{2) другие возможные значения. 


А Х 
$ [АВС 

БһіРІ АЯВАУ 

УПА 


Сдвигает первое значение массива и возвращает его, укорачивая массив наедини- 
цу и смещая все вниз. (Или вверх, в зависимости от того, как вы зрительно пред- 
ставляете себе массив. Мы предпочитаем влево.) Если в массиве нет элементов, 
функция возвращает ипдег. 


Если аргумент АВВАУ опущен, функция сдвигает @_ в лексической области видимо- 
сти подпрограмм и форматов; она сдвигает @АВСУ в областях видимости файлов 
(обычно основной программы) или в лексических областях видимости, установ- 
ленных конструкциями еуа1 5ТАТМ, ВЕСІМ {}, СНЕСК {}, УМТТСНЕСК {}, ТМТТ {} и ЕМ {}. 
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Подпрограммы часто начинают работу с того, что копируют свои аргументы 
в лексические переменные, используя $111: 


ѕир пагіпе { 
пу ФҒаіһоəтз = $11; # глубина 
му $Ғіѕһіеѕ = ѕһіғі; # число рыб 
му $02 = ЅҺіҒЕ; # содержание кислорода 
# 


} 


Также 31111 применяется для обработки аргументов в начале программы: 


мһі1е (деР1пео($_ = ѕһі?ё)) { 
ге-и &8& бо { ипзи1РЕ @АВСУ, $_; 1аѕї }; 
/7-м/ && адо { $МАВК = 1; пех }; 
/^-г/ && до { ФЋЕСОВЅЕ = 1 пехі }; 
сіе "Неизвестный аргумент $_”; 


} 
Для обработки аргументов программ предпочтительнее использовать модули 
беїорі: :319 и беторт: :і опо. 


Начиная с версии у5.14, функция $1111 может принимать ссылку на «неосвящен- 
ный» массив, которая будет разыменована автоматически. Эта особенность 5ћі?Е 
считается экспериментальной. Ее поведение может измениться в будущих верси- 
ях Рег]. 


См. также функции ипѕћіёї, роѕћ, рор и ѕріісе. Функции ѕћ1гї и ипѕћіѓї делают 
с левым концом массива то же самое, что рор и риѕћ с правым. 


ЅҺтсї ИХ 
зһтсї1 70, СМО, АВС 

Вызывает системную функцию Ѕуѕіет У ТРС ѕћтсі (2). Перед вызовом следует 

выполнить изе 1ТРС::5уз\, чтобы загрузить определения констант. 


Если СМ) имеет значение ІРС_5 ГАТ, АЯС должен быть переменной, в которую будет 
помещена возвращаемая структура $1т19_4$. Подобно 10сї1 и їспї1, возвращает 
пое? в случае ошибки, `0 Бит їгие” как обозначение нуля, и фактическое значе- 
ние в остальных случаях. 


Доступна только в системах. поддерживающих Зуѕіет У ТРС. 


$утое* Е 
зһпдеїт КЕУ, 5І/Е, ҒІАб5 


Вызывает системную функцию Зуѕіет У ІРС зйтадеН2). Возвращает идентифика- 
тор сегмента совместно используемой памяти или ипе? в случае ошибки. Перед 
вызовом следует выполнить и$е 5у$\::ТРС. 


Доступна только в системах, поддерживающих Бузфеп: У ІРС. 
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$Атгеад 9! 
Ѕһтгеад ТО, УАВ, Р05, 5І/Е 


Осуществляет чтение из сегмента совместно используемой памяти Ір, начиная 
с позиции 05 размером 517Е (подключаясь, копируя и отключаясь от него). Аргу- 
мент "АВ должен быть переменной, куда функция поместит прочитанные данные. 
Возвращает истинное значение в случае успеха и ложное в случае ошибки. 


Доступна только в системах, поддерживающих Зуз4ет У ІРС. 


зитмийе ТЕТ 
ѕһтмгіъе ІО, $ТВТМ, Р0$, 512Е 


Осуществляет запись в сегмент совместно используемой памяти П), начиная с по- 
зиции Р05 размером 57/Е (подключаясь, копируя и отключаясь путем прикрепле- 
ния к нему, копирования в него данных и открепления от него). Если 5ТА1МС длин- 
нее 51/Е, скопировано будет только 51/Е байтов; если 5ТА1Мб короче 51/Е, недостаю- 
щие байты будут заполнены нулями. Возвращает истинное значение в случае ус- 
пеха и ложное в случае ошибки. 


Доступна только в системах, поддерживающих Ѕузќет У ІРС. (Вы, наверное, уже 
устали это читать, а мы устали это повторять.) 


ѕһиїаоутп [я 5] 


ѕһитаомп 50СКЕТ, НОИ 


Закрывает соединение с сокетом способом, указанным в аргументе НО, Если НОИ 
имеет значение 0, дальнейший прием данных запрещен. Если НОИ имеет значе- 
ние 1, дальнейшая отправка данных запрещена. Если НОИ имеет значение 2, за- 
прещено все. 


ѕһисдомп(50СК, 0); # больше не читать 
ѕһисаомп(50СК 1); # больше не писать 
ѕһитдомп(50СК 2); # больше никакого ввода/вывода 


Это удобно при работе с сокетами, когда необходимо сообщить другой стороне, 
что закончена запись, но не закончено чтение, или наоборот. Это также более на- 
стойчивая форма закрытия, поскольку отключает также все копии дескрипторов 
файлов, имеющиеся в ответвившихся процессах. 


Представьте сервер, которому нужно читать запрос клиента до тех пор, пока не 
будет получен конец файла, а затем отправить ответ. Если клиент вызовет с10$е, 
сокет окажется недоступным для ввода/выводғ, поэтому получить ответ будет 
невозможно. Вместо этого клиент должен использовать ѕћиїйомп и «полузакрыть» 
соединение: 


ѕау ЅЕВМЕВ “ту гециезт“; # отправить какие-то данные 
Ѕһитаомп( ЅЕАМЕВ, 1); # послать ео#; больше не записывать 
$апѕмег = <ЅЕВМЕВ>; # но можно продолжать чтение 


(Если вы пришли сюда, чтобы узнать, как остановить систему, вам придется для 
этого выполнить внешнюю программу. См. ѕзуѕіеп.) 
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Ѕіп [5] 


31п ЁХРА 
іп 


Извините, ничего греховного! в этом операторе нет. Он просто возвращает синус 
выражения ЕХРА (выраженного в радианах). 


Для выполнения операции, обратной синусу, можно вызвать функцию аѕіп из мо- 
дуля Маїћ: Тгід или РОЗ1Х, либо использовать следующее соотношение: 


ѕир аѕіп { аїтап2(% [0], ѕагї(1 - $ [0] + $ [0];) } 


Ѕіеер 


$1еер ЕХРА 
ѕ1еер 


Заставляет сценарий уснуть (сделать паузу) на ЕХРА секунд либо навсегда, если 
аргумент ЕХРА опущен, и возвращает число истекших секунд паузы. Паузу можно 
прервать, послав процессу 516АІ М. В некоторых старых системах пауза может 
продолжаться на одну секунду меньше, чем запрошено, в зависимости от способа 
подсчета секунд. Большинство современных систем точно выдерживает паузу. 
Однако может оказаться, что пауза продолжится дольше, чем нужно, поскольку 
в нагруженной многозадачной системе планирование данного процесса может за- 
держаться. Для определения продолжительности паузы с более высокой точно- 
стью, чем одна секунда, можно воспользоваться функцией и51еер из стандартного 
модуля Тіте::НіАеѕ. Если в системе имеется вызов зе1ес{ (готовых дескрипторов 
файлов), с его помощью можно получить более высокое разрешение времени. В не- 
которых системах ОМ!Х можно также использовать 5у$са11 для вызова вейитег(2) 
и зеннтет(2). Чередование вызовов а1агт и 51еер может оказаться недопустимым, 
поскольку 51еер часто реализуется с помощью а1агт. 


См. также функцию раџѕе в модуле РО5ІХ. 


РЗ] 
ѕоскеї РУ ЕЯ 
ѕоскеї Ѕ0ОСКЕТ, РОМАІМ, ТҮРЕ, РВОТОСОЕ 


Открывает сокет заданного вида и связывает его с дескриптором файла 50СКЕТ. 
ООМАТМ, ТУРЕ и РПОТОСО! задаются так же, как в ѕоскеі2). Если 50СКЕТ не определен, 
он «самооживляется». Вызову этой функции в программе должна предшество- 
вать строка: 


иѕе Ѕоскеї; 
Она поставляет нужные константы. Функция возвращает истинное значениє 
в случае успешного выполнения. Примеры см. в разделе «Сокеты» главы 15. 


В системах, которые поддерживают для файлов флаг закрытия при выполнении, 
этот флаг устанавливается для вновь открытого дескриптора файла в соответст- 
вии со значением $Е. См. переменную $” ($5ҮЅТЕМ_ РО МАХ) в главе 25. 


1 Слово эт, являясь сокращением математического термина «синус», также переводит- 
ся санглийского языка, как «грех». — Прим. перев. 
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А З Г. ГУ | 
зоскерак ИН 
зоскефра1г ЗОСКЕТЛ, ЅОСКЕТ2, ПОМАТМ, ТҮРЕ, РВОТОСОЕ 


Создает неименованную пару сокетов указанного типа в указанном домене. РОМАТМ, 
ТУРЕ и РВОТОСОЕ задаются так же, как в зоскерай(2). Для получения необходимых 
констант используйте изе Ѕоскеї. Если какой-либо из аргументов 5ОСКЕТ1 и 50СКЕТ2 
имеет неопределенное значение, он будет «самооживлен». Функция возвращает 
истинное значение в случае успеха и ложное в противном случае В системах, где 
вызов зоскерай"(2) не реализован, эта функция возбуждает исключение. 


Данная функция обычно вызывается непосредственно перед ѓогк. Один из порож- 
денных процессов должен закрыть 50СКЕТІ, а второй — 50СКЕТ2. Эти сокеты можно 
использовать двунаправленным образом, в отличие от дескрипторов файлов, созда- 
ваемых функцией ріре. В некоторых системах ріре определяется через ѕоскеїраіг, 
и тогда вызов р1ре(Вдг, \г) является, в сущности, такой последовательностью ин- 
струкций: 


изе Ѕоскеї; 

Ѕоскеїраіг(Ваг, Мг, АР МІХ, $0СК_$тнЕАМ, РЕ_ИМ$РЕС); 
ѕһитдомп(Вдг, 1); # запись чигающему процессу запрещена 
Ѕһиаомп(МЕг, 0); # чтение пишущему процессу запрещено 


В Рег 5.8 и выше действие функции имитируется с применением ІР-сокетов для 
хоста Іосаћозѕё, если система реализует сокеты, но не через ѕоскеїраіг. В систе- 
мах, поддерживающих для файлов флаг закрытия при выполнении, этот флаг 
устанавливается для вновь открытого дескриптора файла в соответствии со зна- 
чением $`Е. См. переменную $^Е ($$У5ТЕМ_ЕО_МАХ) в главе 25. См. также пример 
в конце раздела «Двунаправленная связь» главы 15. 


50“ ва! 


ѕогї ЏЅЕВЅИВ ІІТ 
ѕогі ВЕОСК ІІТ 
50гі [15Т 


Сортирует список /157 и возвращает отсортированное списочное значение. По 
умолчанию сортирует в стандартном порядке сравнения строк (с использовани- 
ем, возможно перегруженного, оператора спр). Для сортировки в лексикографи- 
ческом порядке следует использовать модуль (Јпісойе::С011аїе; см. раздел «Сравне- 
ние и сортировка строк Юникода» в главе 6. Проще говоря, самый легкий способ 
реализовать сортировку в алфавитном порядке выглядит так: 


иѕе Ип1соде: :Со1Тате; 
б@а1рһаретіғей 1151 = Џп1соде: : Со11ате->пем->ѕог с(@1151); 


Если действует прагма 1оса]1е, вызов 50гї / 157 отсортирует / 157 в соответствии с те- 
кущими национальными настройками. Даже если такие национальные настрой- 
ки существуют, Регі не поддерживает настройки с многобайтными символами, 
поэтому подобный подход едва ли позволит получить желаемый результат. Если 
требуется обеспечить надежную сортировку в национальных алфавитах, исполь- 
зуйте модуль Џпісойе::Со1аїѓе: :Іоса1е. 


ЏЅЕВЅЏВ, если присутствует, представляет имя подпрограммы, возвращающей це- 
лое число, меньшее, равное или большее 0, в зависимости от того, как должны 
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быть упорядочены элементы списка. (Для трехстороннего сравнения чисел и строк 
можно использовать удобные операторы <=> и спр.) Если аргумент //5Е85//6 задан, 
но функция не определена, ѕогї возбудит исключение. 


С целью повышения производительности вызов подпрограммы выполняется 
в обход обычной процедуры вызова, а потому подпрограмма не должна быть ре- 
курсивной (нельзя также выходить из блока или подпрограммы с помощью опе- 
раторов управления циклом), сравниваемые элементы передаются в подпрограм- 
му не через @_, а временно присваиваются глобальным переменным $а и $0 паке- 
та, в котором была скомпилирована ѕогї (см. примеры ниже). Переменные $а и $6 
являются псевдонимами фактических значений, поэтому не изменяйте их в под- 
программе. 


Подпрограмма сравнения должна корректно вести себя. Если она действует непо- 
следовательно (например, иногда сообщая, что $х[1] меньше $х[2], а иногда утвер- 
ждая обратное), результат сортировки будет сложно предсказать. (Это еще одна 
причина, почему не следует модифицировать $а и $0.) 


Аргумент и5ЕРЗИВ может быть именем скалярной переменной (без индексов), и то- 
гда он задает символическую или жесткую ссылку на подпрограмму, которая 
должна использоваться. (Символическое имя, но не жесткая ссылка, допускает- 
ся, даже когда действуег директива изе ѕігісї ‘геѓЁѕ'.) Вместо /5Ен5/8 можно за- 
дать блок в качестве анонимной внедряемой (іпіпе) подпрограммы сортировки. 


Чтобы выполнить обычную сортировку чисел, скажите: 


ѕир питег1са11у { $а <=> $6 } 
@ѕогтейбупитрег = ѕогЕ питегіса11у 53, 29, 11, 32,7; 


Чтобы выполнить сортировку в порядке убывания, можно просто применить по- 
сле сортировки геуегзе либо поменять местами $а и $6 в подпрограмме сортировки: 


@деѕсепділд = геуегзе ѕогі питегіса11у 55, 29, 11, 32,7; 


ѕир геуегѕе_пџитегіса11у { $6 <=> $а } 
@деѕсепаіпо = ѕогї геуегѕе_питегіса11у 53, 29, 11, 32,7; 


Чтобы выполнить сортировку АЗСП-строк без учета регистра, перед сравнением 
пропустите $а и $0 через 1с: 


@ипѕогїтед = ом/ѕраггом Озігісһ ГАНК саїріга Б1оечАУИ; 
@ѕогїеа = ѕогі { 1с($а) стр 1с($6) } @ипзогїеа; 


В случае работы с Юникодом (в отличие от АЗСП) ни 1с, ни ис нє могут использо- 
ваться для канонизации регистра, поскольку отношения между символами в раз: 
ных регистрах имеют более сложную форму, чем могут выразить эти две функ: 
ции. В настоящее время различаются три регистра символов, а не два, и между 
ними нет прямого, однозначного соответствия — например, некоторым символам 
в верхнем регистре соответствует несколько символов в нижнем регистре, и на- 
оборот. Ожидается, что для решения этой проблемы в Рег] когда-нибудь появится 
поддержка функции ГС, названной так, потому что она производит «свертку реги- 
стра» (сазе 19), как это делает модификатор /1 шаблонов. Функция їс должна по- 
явиться примерно в Ре! версии %5.16, возможно, в виде изе Театиге "їс". Если 
функция їс будет доступна – используйте ее вместо 1с в своих алгоритмах сорти- 
ровки, использующих спр, за исключением случаев, когда сортируемый текст 
весьма замысловатый или вы желаете выполнить сортировку по числовым значе- 
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ниям кодов символов. Если функция їс недоступна или требуется отсортировать 
текст в алфавитном (словарном) порядке, а не по кодам символов, читайте раздел 
«Сравнение и сортировка строк Юникода» в главе 6. 


Функция $0г{ часто применяется для сортировки хешей по значениям. Напри- 
мер, если хеш %за1ез_атоип* содержит записи объемов продаж по подразделени- 
ям, выполнение в программе сортировки поиска в хеше позволяет отсортировать 
ключи по соответствующим им значениям: 


# сортировать подразделения по объемам продаж в порядке убывания 
ѕиб руѕа1еѕ { $ѕа1еѕ атоипї{ $0} <=> $ѕа1еѕ атоџпї{$а} } 


Тог $@ері (ѕогї буѕа1еѕ Кеуз Жѕа1е апошпї) { 
ѕау "$дері => $ѕа1еѕ атоџпї{ $аері}“; 
} 


Можно создавать дополнительные уровни сортировки, образуя каскады из не- 
скольких сравнений с помощью операторов || или ог. Это возможно благодаря то- 
му, что операторы сравнения возвращают 0 для эквивалентных значений, благс- 
даря чему выполнение «проваливается» к следующему сравнению. В следующем 
примере ключи хеша сортируются сначала по объемам продаж, а затем по самим 
ключам (в случае, если два или более подразделений имеют одинаковый объем 
продаж): 


ѕиб бу _ѕа1еѕ_іһеп_ дері { 
$ѕа1еѕ атоџипї {$0} <=> фѕа1еѕ атоипї {Фа} 
А 
фа стр $6 
} 


Рог $оерт (зогт ру_за1ез_1Неп_аерт кеуѕ %ѕа1е атоџпї) { 
зау "$ерї => $ѕа1еѕ_атоџпі {$ерї}”; 
} 


Предположим, что @гесз представляет собой массив ссылок на хеши, и каждый 
хеш содержит поля ЕТНУТМАМЕ, ГАЗТМАМЕ, АСЕ, НЕІСНТ и ЗАЕАВУ. Следующий код отсор- 
тирует записи о людях, перемещая вперед тех, кто богаче, затем выше, затем мо- 
ложе, затем в алфавитном порядке имен: 


ѕир ргоѕресїѕ { 
$6->{ЗАЁАНУ} <=> фа->{ЅАГАВҮ) 
Е. <=> $а->{НЕІСНТ} 
а <=> $0->{АбЕ} 
Фа Ш стр $0-> {ТАЗТМАМЕ} 


1 
$а->{РТАЗТМАМЕ} стр $0->{ҒІАЅТМАМЕ} 


@ѕогїеа = ѕогї ргоѕресїѕ @гесз; 


Основой для сравнения в процедуре сортировки может стать любая полезная ин- 
формация, которую можно извлечь из $а и $6. Например, если строки текстг 
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должны быть отсортированы согласно определенным полям, для извлечения по- 
лей при сортировке можно использовать функцию $1111. 


@ѕогїей 1іпеѕ = ѕогї { 
ба_?іе105 = ѕр1ії /:/, $а; # поля. разделяемые двоеточиями 
ёр _Ғіе145 = ѕр1ії /:/, $6; 


$а тіе105[3] <=> $0 Ғіе105[3] # числовая сортировка по полю #4 затем 


И 
$а Ғіе105[0] стр $0 _?1е105[0] # строковая сортировка по полю #1, затем 


И 
фо ғіе105[2] <=> $а Ғіе105!2] # числовая сортировка в порядке убывания 
И в по полю #3 
4% # и так далее 
} 6@11пез; 
Однако поскольку ѕ0гї выполняет подпрограмму сортировки много раз с различ- 
ными комбинациями значений $а и $0, в приведенном примере каждая строка бу- 
дет расщепляться многократно. 


Чтобы избежать затрат на повторное выполнение таких действий, как расщепле- 
ние строк для сравнения полей, действие по извлечению данных можно выпол- 
нить один раз перед сортировкой и сохранить полученную информацию. Вот как 
создаются анонимные массивы для хранения каждой строки вместе с результата- 
ми ее расщепления: 


@{етр = мар { [$_, 5р1ії /:/] } @1іпеѕ, 
После этого сортируются ссылки на массивы: 


@Тетр = ѕогї { 
ба Ріе105 = @Фа[1..$#$а]: 
@Б_11е19$ = @$Ы[1. .$#$6]; 


$а Ғіе105[3] <=> $0 Ғіе105[3 ] # числовая сортировка по полю #4, затем 
И 
фа_Р1е19310] стр $6_ГЕ1е19$[0] # сортировка строк по полю #1 затем 
11 
$6 _Ғіе105[2] <=> $а Ғіе105[2] # числовая сортировка в порядке убывания 
11 # по полю #3 
15 # и так далее 
} @тетр; 
После сортировки ссылок на массивы из них можно извлечь исходные строки: 
@ѕогтей 1іпеѕ = тар { $_->[0] } @етр; 


Данный прием пар-ѕогі-пар, который часто называют преобразованием Шварца 
(Ѕсһуагіғіап Тгапѕѓогт)!, может быть выполнен в одну инструкцию: 


@ѕогіеб 1іпеѕ = тар { $_->[0] } 
ѕогї { 
$а->[4] <=> $0->[4] # осторожно: индексы действительно 
# начинаются с 1 


1 Вчесть ее автора – Рэндала Шварца. Описывается, например, на странице ћѓїр://тет- 


Бегѕ.һоте.пеі/апагеш-јоһпѕоп/регіЈагсһћіі/тѕ200041.№ті. – Прим. ред. 
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И 

$а->[1] стр $6->[1] 
И 

$а->[3] <=> $6-;[3] 
И 


} 
тар { [$_, эр /:/] } @іпеѕ; 


Не объявляйте $а и $6 как лексические переменные (с помощью пу). Это — глобаль- 
ные переменные пакета (хотя на них не распространяются обычные ограничения 
глобальных переменных при использовании изе ${г1с{). Однако подпрограмма 
сортировки должна находиться в том же пакете, либо квалифицировать $а и $6 
именем пакета вызывающей подпрограммы. 


Ко всему этому добавим, что можно писать подпрограммы сортировки с обыч- 
ным способом передачи аргументов (и, что не случайно, использовать подпро- 
граммы ХӨ в качестве подпрограмм сортировки) при условии, что подпрограмма 
сортировки объявляется с прототипом ($$). В этом случае $а и $6 можно объяв- 
лять как лексические переменные: 


$6 питегіса11у ($$) { 
ту ($а, $6) =@; 
$а <=> $0. 


} 


Когда-нибудь, когда будут реализованы полные прототипы, вы сможете просто 
сказать: 


ѕир пимег1са11у (Фа. $6) { Фа <=> $6 } 


и тогда мы вернемся к тому, с чего начали. Более или менее. 


В Рей у5.6 и более ранних версий сортировка реализована с использованием алго- 
ритма быстрой сортировки (дшсЁзог®. Этот алгоритм не устойчив и может пока- 
зывать квадратичную сложность. (Устойчивый алгоритм сортировки должен со- 
хранять исходный порядок следования элементов, если они равны. Хотя в среднем 
по всем массивам длины п производительность алгоритма быстрой сортировки со- 
ставляет О(п 106 п), иногда его производительность может снижаться до О(п?).) 
В экспериментальной версии У5.1 вместо алгоритма быстрой сортировки исполь- 
зуется реализация устойчивого алгоритма сортировки слиянием (тегрезог), ко- 
торый в худшем случае имеет производительность О(п Іоє п). Однако тесты пока- 
зывают, что при некоторых исходных данных на некоторых платформах исход- 
ный алгоритм быстрой сортировки работает быстрее. В Рег1 версии у5.8 появилась 
прагма зог+, обеспечивающая ограниченные возможности управления сортиров- 
кой. Вероятно, этот не совсем полноценный контроль над алгоритмом сортировки 
исчезнет в будущих версиях Ре], но возможность охарактеризовать ввод или вы- 
вод, скорее всего, останется. См. раздел «ѕогі» в главе 29. 


в г 
ѕріісе 5@ к 

ѕр1ісе АВААҮ, ОРЕЗЕТ, ВЕМСТН, 118Т 

ѕр1ісе АЯВАУ, ОЕЕЗЕТ, 1ЕМБТН 

ѕр1ісе АВААУ, ОҒЕЅЕТ 

ѕр1ісе АЛВАҮ 
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Удаляет элементы, задьваемые ОРЕЗЕТ и [ЕМСТН, из АВРАУ и заменяет их элементами 
из 1157, если он задан. Если смещение ОРЕЗЕТ отрицательно, отсчет начинается 
с конца массива, но если получившаяся позиция окажется перед началом масси- 
ва, возникает исключение. В списочном контексте $р11се возвращает элементы, 
удаленные из массива. В скалярном контексте возвращает последний удаленный 
элемент или ипдег, если такого не было. Если число новых элементов не равно чис- 
лу прежних элементов, массив при необходимости расширяется или сокращает- 
ся, а индексы элементов изменяются соответственно. Если длина [ЕМСТН опущена, 
функция удаляет все до конца, начиная с ОРЕЗЕТ. Если опущены оба аргумента, 
ОЕЕЗЕТ и [ЕМСТН, функция удалит все элементы из массива. Если позиция ОРЕЅЕГ 
окажется за концом массива, Рег выведет предупреждение, а список /Т5Т будет 
добавлен в конец массива. 


Эквиваленты перечислены в табл. 27.5. 


Таблица 27.5. Эквиваленты функции ѕріісе при работе с массивами 


Прямой метод Эквивалент ѕріісе 
риѕћ(@а. $х. $у) ѕр1ісе(ёа, ба, 0, $х, $у) 
рор(@а) ѕр11се(@а, -1) 

$111 (@а) ѕр1ісе(@а, 0, 1) 
ипѕпіё(@а, $х, $у) $р11се(@а, 0, 0, $х, $у) 
фа[$х] = $у $р11се(@а, $х. 1. $у) 
(@а, ба = ()) эр 1се(@а) 


Функцию $р1ісе удобно также применять для разрезания списка аргументов, пе- 
реданных подпрограмме. Допустим, например, что перед списками передаются 
их длины: 


зи6 1151 ед { # сравнить два списочных значения 
пу ёа = $р11се(®_, 0, 5һіғї); 
пу @0 = $р11се(@_. 0, зп11т); 
гефигп 0 ип1ез$ @а == @0; # одинаковая длина? 
мһі1е (@а) { 
гетигп 0 1+ рор(@а) пе рор(@р); 


} 


гефигп 1: 


} 
1Ғ (1151 ед($1еп, @ғоо[1. .$1еп], зса1аг(@Баг; @баг)) { } 


Однако лучше использовать для этого ссылки на массивы. 


Начиная с версии у5.14 5р1ісе может принимать ссылку на «неосвященный» хеш 
или массив, которая будет разыменована автоматически. Эта особенность 5р]ісе 
считается экспериментальной. Ее поведение может измениться в будущем. 


ѕрій т] 


$р11{ /РАТТЕЯМ/, ЕХРА, ЕТМТТ 
5р1іт /РАТТЕНМ/, ЕХРВ 

зр1ії /РАТТЕВМ/ 

5р11ї 
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Просматривает строку ЕХРА в поисках разделителей и расщепляет ее на список 
подстрок, возвращая в списочном контексте полученный список, а в скалярном 
контексте число подстрок.! Разделители находятся путем многократного поиска 
по шаблону с использованием регулярного выражения РАТТЕНА, поэтому раздели 
тели могут иметь любой размер и не обязаны быть одной и той же строкой в каж- 
дом поиске. (Обычно разделители не возвращаются; исключения из этого прави- 
ла излагаются ниже.) Если шаблон не удается отыскать в строке, $р1{ возвраща- 
ет исходную строку в качестве единственной подстроки. При нахождении одного 
соответствия возвращаются две подстроки и т. д. В шаблоне можно использовать 
модификаторы регулярных выражений, например /РАТТЕРМ/1, /РАТТЕВМ№/х и тому 
подобные. В случае расщепления по шаблону /^/ предполагается наличие моди- 
фикатора //п. 


Если число ІІМІТ задано и больше нуля, строка расщепляется не более чем на за- 
данное число полей (хотя число полей может быть меньше, если разделителей 
окажется меньше). Если число [МТТ отрицательно, считается, что была задана 
произвольно большая граница /ІМІТ. Если граница опущена или равна нулю, за- 
мыкающие пустые поля удаляются из результата (о чем следует помнить тем, кто 
будет использовать рор). Если опущен аргумент ЕХРА, расщепляется строка $_. Ес- 
ли шаблон РАТТЕРМ тоже опущен или задан как пробел, ` ", осуществляется расще- 
пление по пробельным символам. /\5+/, после пропуска всех ведуших пробель- 
ных символов. 


Значение /^/ в аргументе РАТТЕРМ неявно интерпретируется как /^/п, поскольку ис- 
пользовать его иначе не имеет смысла. 


Можно расщеплять строки любой длины: 


@спаг$ = $р1ії //, $мога; 
@11е10$ = $р11% /:/, $1іпе; 
@ногдѕ $р114 “ ", Фрагадгари, 
611пе$ = 5ріії /^/, $Ыиғғег; 


Функцию 5р!ії можно также использовать для расщепления строки на последо- 
вательность графем, но гораздо проще использовать для этой цели простое сопос- 
тавление с регулярным выражением: 


дгер { Іепоїћ } зр11 /(\Х)/, $мога; 
$мога =- /\Х/д; 


Шаблон, который может находить соответствие пустой строке или чему-то более 
длинному, чем пустая строка (например, шаблон, состоящий из одного символа 
с квантификатором * или ?), расщепляет значение ЕХРР на отдельные символы, ес- 
ли находит пустую строку между символами; непустые соответствия пропуска- 
ют символы найденного разделителя обычным образом. (Иными словами, шаб- 
лон не будет соответствовать в одной точке более одного раза. даже если найдено 
соответствие нулевой ширины.) Например: 


@9гари$ 
@одгарћѕ 


ргіпі ]01п(”:” => $р11 / */, і їһеге”); 


выведет "һ:і:1:һ:е:г:е. Пробел исчезает, поскольку он интерпретируется как 
часть разделителя. В тривиальном случае пустой шаблон // просто расщепляет 


1 Вскалярном контексте 5р11ї также записывает результат в ©, но это устаревшая осо- 
бенность. 
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строку на отдельные символы, и пробелы не исчезают. (При обычном поиске по 
шаблону // повторяет поиск по последнему успешно найденному шаблону, но 
в 5р11ї шаблон представляет собой исключение из этого правила.) 


При наличии аргумента / ТМ1Т расщепляется только часть строки: 
пу ($1091п, $раззма $гетаіпдег) = $р11ї / /. $, 3: 


Мы рекомендуем такое расщепление в список имен, которое позволит сделать 
код самодокументирующимся. (При проверке ошибок учитывайте, что значение 
фгетаіпдег окажется неопределенным, если в строке меньше трех полей.) При при- 
сваивании списку, когда аргумент /1МТ отсутствует, Регі использует для /ІМІТ 
значение на единицу большее, чем число переменных в списке, чтобы избежать 
лишней работы. В примере выше /1М1Т по умолчанию будет иметь значение 4, 
и $тета1паег получит только третье поле, а не все оставшиеся поля. В приложени- 
ях, где важна скорость выполнения, следует выделять не более полей, чем дейст- 
вительно требуется. (Коварство мощных языков в том. что времевами они позво- 
ляют делать мощные глупости.) 


Ранее мы говорили, что разделители не возвращаются, но если РАТТЕВМ содержит 
круглые скобки, в список с результатом включаются подстроки, соответствую- 
щие каждой паре скобок, перемежаясь с обычно возвращаемыми полями. На- 
пример, вызов: 


зразе /([-,1)/, '1-10,20°; 
вернет список: 
Сано: сле 90) 


Если скобок больше, поле возвращается для каждой пары, даже если каким-то 
парам не найдено соответствия, и тогда в этих позициях возвращаются неопреде- 
ленные значения. Поэтому, если сказать: 


ры /(-)1(.)/. "1-10, 20"; 
будет получено значение: 
(1, - , опае?, 10. ипдбеғ, ‚ 20) 


Аргумент /РАТТЕЯМ/ можно заменить выражением, которое будет задавать шабло- 
ны. изменяющиеся во время выполнения программы. 


В частном случае, когда выражение ЕХРА состоит из одного пробела (" ), функция 
производит расщепление по пробельным символам, как $р1ії без аргументов. По- 
этому с помощью 5р111(" ”) можно эмулировать режим работы ашЁ по умолча- 
нию. Напротив, $р111(/ /) даст столько нулевых полей в начале, сколько имеется 
ведущих пробелов. (Другой частный случай, когда вместо регулярного выраже- 
ния передается строка: она все равно будет интерпретирована как регулярное вы- 
ражение.) Это свойство можно использовать для удаления из строки ведущих 
и замыкающих пробелов и замены встречающихся в середине серий пробельных 
символов на один пробел: 


$$1г1п9 = јоіп(“ , ѕр1іұ(" ” $әїгіпд)); 


В следующем примере заголовок сообщения КЕС 822 расщепляется в хеш, содер- 
жащий поля $һеафаїе}, $һеай{500јесї} и т.д. Здесь используется прием присваи- 
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вания хешу списка пар, основанный на том обстоятельстве, что разделители че- 
редуются с разделяемыми полями. Чтобы вернуть часть каждого разделителя 
как часть возвращаемого списка, используются круглые скобки. Поскольку шаб- 
лон 5р11ї гарантированно возвращает значения парами, так как содержит одну 
пару круглых скобок, операция присваивания хешу гарантированно получит 
список пар ключ/значение, где каждый ключ является именем поля заголовка. 
(К сожалению, этот прием приводит к потере информации, если несколько строк 
имеют одинаковое ключевое поле, например строки Бесеіуед-Ву. Увы...) 


фһеадег =- 5/\п\5+/ /9; # Слить строки продолжения 
Фпеаа = ("РАОМТӘТЈЕЕ", ѕр1іт /^(\$*?):\з»*/т, $неадег); 


В следующем примере обрабатываются записи из файла раз54(5) ОМХ. Можно 
опустить сһопр, и тогда последним символом $5ће11 будет символ перевода строки. 


ореп РАЗЗМО, "/еїс/раѕѕма”; 
мһі1е (<РАЗЗИО>) { 


сһотр; # удалить замыкающий перевод строки 
($1091п, Фраззма, $иіа, $919, $0соѕ, $һоте, $5һе11) = 
5р1ії /:/; 


} 


Вот как можно обработать каждое слово каждой строки каждого входного файла, 
чтобы создать хеш с частотами слов: 


мһі1е (<>) { 
Гог ту $мога (5р11ї) { 
$соипї{ $мога)} ++; 


} 


Действие, обратное $р111, осуществляет јоіп (если не считать, что јоіп может уста: 
навливать между всеми полями только один разделитель). Для разбиения на час- 
ти строки с полями фиксированной длины используйте ипраск. 


рип 
ѕргіпї? РОВМАТ, [Т5Т 


Возвращает строку, отформатированную в соответствии с обычными соглаше- 
ниями ргіпі?, т.е. соглашениями функции ѕргіпіѓ библиотеки С. Разъяснение об- 
щих принципов читайте в описании рт} (3) или ргіпі/ (3) для вашей системы. 
Строка ГОВМАТ содержит текст со спецификаторами полей, замещаемыми элемен- 
тами из [15Т, по одному на каждое поле. Описание полей вы найдете в разделе 
«Форматы строк» главы 26. 


59ГЕ 1$— ба 
ѕӯгі ЕХРВ 
59гЇ 


Возвращает квадратный корень из ЕХРН. Другие корни, например кубические, 
можно получить при помощи оператора »*, возведя число в дробную степень. Не 
пытайтесь применять эти подходы к отрицательным числам, поскольку возведе- 
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ние в степень отрицательных чисел – несколько более сложная задача (и в ре- 
зультате возникает исключение). Но существует стандартный модуль, который 
умеет делать даже это: 


узе Маїћ: : сотр1ех, 
ргіпі $9г=(-2); # выведет 1.41421356237311 


гапа 


ѕгапа ЕХРВ 
ѕгапа 


Устанавливает начальное случайное число для оператора гапа. Если выражение 
ЕХРВ опущено, используется полуслучайное значение, предоставляемое ядром (ес- 
ли оно поддерживает устройство /4ео/игап4от) или полученное, среди прочего, на 
основе идентификатора процесса и текущего времени. В любом случае, начиная 
с версии у5.14, функция возвращает начальное число последовательности псевдо- 
случайных чисел (зеед). Как правило, нет необходимости вызывать ѕгапӣ, посколь- 
ку, если не вызвать ее явно, она будет вызвана неявно при первом использовании 
оператора гапа. Однако в Регі до версии 5.004 это было не так, поэтому, если сцена- 
рий должен работать со старыми версиями Рег|, он должен явно вызывать эгапод. 


Часто вызываемые программы (такие, как сценарии ССІ), которые в качестве на- 
чального числа берут просто 11те ^ $$, могут пасть жертвой того математического 
свойства, что а`Б == (а+1)^(6+1) в одной трети случаев. Поэтому не делайте так. 
Лучше используйте: 


эгапа( їіте() ^ ($$ + ($$ << 15)) ); 


Для криптографических задач понадобится что-нибудь гораздо более случайное, 
чем начальное число по умолчанию. В некоторых системах годится устройство 
/4ео/тап4от.. В иных случаях часто применяется контрольная сумма сжатого вы- 
вода одной или более программ, возвращающих быстро меняющееся состояние 
операционной системы. Например: 


згапа (+1те ^ $$ ^ ипраск “%321*”. 'рѕ умах1 | 92ір`); 


Если вы этим особенно озабочены, ознакомьтесь с модулем Маїћ: :ТгиуВапаот 
в СРАМ. 


Не следует вызывать в программе згапд несколько раз. кроме, конечно, тех слу- 
чаев, когда вы точно знаете, что и зачем делаете. Назначение этой функции - дать 
начальное значение для функции гапӣ, чтобы она могла создавать неодинаковые 
случайные последовательности при каждом запуске программы. Сделайте это 
один раз в начале программы, иначе гапд не даст вам случайные числа! 


22 
та ме 
зтаЕ ЕТЕЕНАМОЕЕ 
ѕтаї ОТВНАМОЕЕ 


ЅТтаї ЕХРЯ 
ѕїаї 


В скалярном контексте возвращает логическое значение — признак успешности 
вызова. В списочном контексте возвращает список из 18 элементов, содержащий 
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статистику файла, открытого через дескриптор РЛ ЕНАМІЕ или ОТАНАМОЕЕ, или фай- 
ла, имя которого указано в ЕХРА. Обычно используется так: 


($Чем, $іпо, Фтоде, $п11пк, $и19, $919, $гаеу, $512е, 
$атіпе, $тЕ1те, $стіте, $01к5і2е, $6] оскз) 
= ѕтаї $ғі1епапе; 


Не все файловые системы поддерживают полный перечень полей; в неподдержи- 
ваемых полях возвращается 0. Значения полей приведены в табл. 27.6. 


Таблица 27.6. Значения, возвращаемые ѕіаї 


Номер | Поле Значение 


0 $Чеу Номер устройства файловой системы 

1 $іпо Номер іподе 

2 $тоде Режим файла (тип и разрешения) 

8 $п]іпк Число (жестких) ссылок на файл 

4 Фила Числовой идентификатор пользователя-владельца файла 

5 $919 Числовой идентификатор группы-владельца файла 

6 $гдеу Идентификатор устройства (только специальные файлы) 

и $517е Суммарный размер файла в байтах 

8 $аїіте | Время последнего обращения к файлу в секундах с начала эпохи 

9 $тЕ1те ! Время последней модификации файла в секундах с начала эпохи 

10 $сііте | Время изменения іподе (не время создания!) в секундах с начала эпохи 
п $01кѕіғе | Предпочтительный размер блока для ввода/вывода файловой системы 


$1оск$ | Фактическое число выделенных блоков 


Поля $0еу и $іпо в совокупности уникально идентифицируют файл в системе. 
$61К$12е и $010скѕ определены, скорее всего, только в файловых системах, произ- 
водных от ВО. Поле $010скѕ (если определено) измеряется в блоках по 512 байт. 
Значение $010ск5*512 может существенно отличаться от $5іге для файлов, содер- 
жащих невыделенные блоки, или «дыры», которые не учитываются в $610ск$. 


Если в ѕїаї передается специальный дескриптор файла, состоящий из символа 
подчеркивания, фактически ѕіаі(2) не выполняется, а возвращается текущее со- 
держимое структуры ѕїаї, полученной в результате последнего вызова ѕїаї, 131а1 
или оператора проверки файла на основе ѕїаї (например, -г, -м или -х). 


Поскольку режим файла содержит его тип и права доступа, чтобы увидеть дейст- 
вующие права, нужно замаскировать часть, содержащую тип файла, и вывести 
фактические права при помощи гл Т или ѕргіпіѓ со спецификатором "%0`: 


$поде = (ѕТаї($ғі1епате))[21; 
ргіпіғ "Регтіѕѕіопѕ аге Ж040\п“, $тоде & 07777; 


Модуль Ее: :зтат предоставляет удобный механизм доступа по именам: 


иѕе Рі1е: :5їаї; 
$50 = этае($Еепапе); 
ргіпі? “Ре 13 %5, $126 1$ %3, реги #040, пііте %з\п”, 
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$ғіЛепате, $$6->$12е, $50->тоде & 07777, 
эса1аг 1оса1л4ме $$5->мЕ те; 


Можно также импортировать символические определения различных разрядов 
режима из модуля Есп11. 


иѕе Рси{1 ':тойе`. 
$поде = (5$1а1($7і1епате))[21; 


Физег_гих ($тоде & 5 ТВМХУ) >> 6; 
$9гоир_геад ($поде & 5 ІВОВР) >> 3: 
Фотнег_ехесите = Фтоае & $ ТХОТН; 


ргіпғ "Права доступа: %040\п", $_ТМОБЕ( $тоае), \п"; 


$15 ѕеіиџіа = $тоде & $ 15110: 
$15 _Ч1гестогу = $ _150ТН($тоде); 


Две последние инструкции можно было бы заменить операторами -и и -0. Допол- 
нительную информацию вы найдете в описании ѕіаѓ(2). 


Совет: чтобы получить только размер файла, используйте оператор проверки 
файла -5, непосредственно возвращающий размер в байтах. Сушес:вуют также 
проверки, возвращающие возраст файла в днях. 


$фае 


ѕіате ЕХРА 

Зфате ТҮРЕ ЕХРВ 

Зтафе ЕХРА : АТТАС 
ЗТате ТУРЕ ЕХРН : АТТВЅ 


Объявление зтате создает переменную в лексической области, по аналогии с объ- 
явлением пу. Однако содержимое переменных, объявленных как ѕїіаїе, сохраня- 
ется между вызовами одной и той же подпрограммы; такие переменные инициа- 
лизируются только один раз — при первом входе в область их видимости, и нико- 
гда не инициализируются повторно, в отличие от лексических переменных, ини- 
циализирующихся каждый раз при входе в область видимости. 


Когда образуется замыкание, оно считается новой подпрограммой, поэтому лю- 
бые ѕїаїе-переменные инициализируются в новой копии замыкания при первом 
вызове. Эти переменные не являются статическими в понимании языка С, если 
только сама подпрограмма не является статической. 


Объявление ѕіаїе может использоваться только в области действия прагмы изе 
Теафиге "ѕїаїе”. См. раздел «Ёеафиге» в главе 29. В настоящее время полноценная 
инициализация ѕїаіе-переменных поддерживается только для скаляров, однако 
всегда можно использовать скалярную ссылку на массив или хеш. 


ѕіиау [5 


зіџду САГАЯ 
зфиду 


Эта функция тратит время на изучение 5САЕАВ, предполагая многократное сопос- 
тавление с шаблоном, прежде чем строка будет модифицирована. При этом мож- 
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но сберечь, а можно и не сберечь время, что зависит от природы и числа шаблонов 
поиска и от распределения частот символов в строке, в которой осуществляется 
поиск, — возможно, придется сравнить время выполнения с применением зтиду 
и без оного, чтобы узнать, какой вариант быстрее. Больше всего выигрывают от 
применения ѕіџбу циклы, в которых сканируется множество коротких неменяю- 
щихся строк (в том числе постоянные части более сложных шаблонов). Если необ- 
ходимо найти постоянные строки, привязанные к началу, зтиду вообще не помо- 
жет, поскольку никакого сканирования не производится. Одновременно можно 
иметь только одну активную ѕїџіу; если начать изучение нового скаляра, резуль- 
таты для первого будут потеряны. 


Работает ${иду так. Создается связанный список для каждого символа строки, 
в которой будет производиться поиск, чтобы знать, например, где располагаются 
все символы «К». В каждой строке поиска на основании некоторых статических 
таблиц частот, построенных с помощью С-программ и английского текста, выби- 
рается символ, встречающийся реже всего. Исследуются только те места, где этот 
символ находится. 


Вот, например, цикл, который вставляет элементы, порождающие именной ука- 
зателыь, перед каждой строкой, содержащей некоторый шаблон: 


мһі1е (<>) { 
ѕїиду; 
ргіпі ".ІХ Ғоо\п" іт /\Юғоо\0/; 
ргіпі ".ІХ Баг\п” і? /Хобаг\0/; 
ргіпі “.ІХ Миг п” 1 /\об1игғ1Х\ЫЬ/ 
рг1пї, 
} 
При поиске /\ЬТос\Ь/ будут рассматриваться только те места в $ , которые содер- 
жат «Ї», так как «Ё» встречается реже, чем «о». Это дает большой выигрыш, за 
исключением патологических случаев. Остается только невыясненным, больше 
ли будет сэкономлено времени, чем было потрачено для построения связанного 
списка. 


Если потребуется выполнять поиск в строках, не известных до момента выполне- 
ния, можно сконструировать цикл в строке и скормить эту строку функции е\а1, 
чтобы избежать постоянной перекомпиляции шаблонов. Если задать в $/ чтение 
файлов целиком, этот подход может дать превосходные результаты по скорости — 
и часто будет быстрее, чем применение специализированных программ вроде 
Тетер(1). Следующий код просматривает список файлов (6111е3) в поисках списка 
слов (@мога5) и выводит имена файлов, где были найдены соответствия, без учета 
регистра символов: 


$ѕеагсһ = “иные (<>) { ѕтиду; 
Гог ту $могд (@могаз) { 
$ѕеагсһ = "++\$зееп{\$ААСУ} 1 /\\Ь$мога\\Ь/т; \п"; 
} 
$зеагсй .= "}”; 
@АВСУ = @?і1еѕ; 


1 Здесь авторы имеют в виду тематический указатель имен, приводимый в конце кни- 
ги. — Прим. перев. 


Функции Рей в алфавитном порядке 


ипает $/; # читать файл целиком 
ема1 $зеагсп; # перехватывает исключение 
Оіе $@ 11 $6, # в случае неудачи еуа1 
$/ = "№", # восстановить обычный символ завершения ввода 
Гог му $ЕПе (ѕогі Кеуз(%зееп)) { 
ѕау "$Ғі1е”; 


} 


899 


Сейчас, когда у нас есть оператор 1г//, сложные е\а1 этапа выполнения, которые 


мы видели выше, не столь необходимы. То же самое можно сделать иначе: 


@рагз = (); 
Ғог ту Фмога (@логӣѕ) { 
риѕћ @ратз, дг/\0%{мога}\0/1; 
} 
@АВСУ = @ғі1еѕ; 
ипдег $/; # вводить каждый файл целиком 
мне (<>) { 
Тог $раї (@раїѕ) { 
$зееп{ФАВСМ} ++ 11 /$раү/; 
} 
} 


$/ = “№”, й восстановить обычный символ завершения ввода 
Тог ту $7116 (ѕогі Ккеуѕ(%ѕееп)) { 
зау "ЗЕ е”; 
} 
ѕиБ 


Именованные объявления: 


ѕир МАМЕ РВОГО АТТВУ 
ѕир МАМЕ АТТЯ$ 

ѕ00 МАМЕ РАОТО 

ѕиб МАМЕ 


Именованные определения: 


ѕир МАМЕ РАОТО АТТАЅ ВЕОСК 
зиб МАМЕ АТТА ВІ ОСК 

ѕиб МАМЕ РВОТО ВІОСК 

ѕир МАМЕ ВЕОСК 


Неименованные определения: 


ѕир РЯОТО АТТВ$ ВЕОСК 
ѕир АТТАЅ ВЕОСК 

ѕир РАОТО ВЕОСК 

$и6 ВЕОСК 


Синтаксис объявлений и определений подпрограмм кажется сложным, но на 


практике он довольно прост. Вот его основа: 


ѕибр МАМЕ РВОТО АТТВЅ ВЕОСК 


Все четыре поля не обязательны; единственное ограничение состоит в том, что по- 
ля, которые присутствуют, должны быть расположены в указанном порядке и что 
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необходимо использовать хотя бы одно из полей МАМЕ и ВОСК. Некоторое время мы 
не будем обращать внимания на РЯОТО и АТТА$; они просто изменяют основной син- 
таксис. А МАМЕ и ВЕОСК — важные параметры, с которыми необходимо разобраться: 


• Если указан только аргумент МАМЕ без В/ОСК, — это предварительное объявление 
имени (чтобы позднее вызвать эту подпрограмму, придется в дальнейшем дать 
определение, содержащее и МАМЕ, и ВЕОСК). Именованные объявления полезны, 
поскольку синтаксический анализатор обращается с именем особым образом, 
если знает, что это подпрограмма, определенная пользователем. Такую под- 
программу можно вызвать как функцию или как оператор, подобно любой 
другой встроенной функции. Иногда их называют опережающими объявле- 
ниями (югшага дедаганоп3). 


• Если указаны и МАМЕ, и ВЕОСК – это стандартное определение (деѓіпібіоп) имено- 
ванной подпрограммы (а также объявление, если оно не было сделано рань- 
ше). Именованные определения полезны, потому что связывают фактическое 
значение В/0СК (тело подпрограммы) с объявлением. Это все, что мы имеем 
в виду, говоря, что это определение подпрограммы, а не просто объявление ее. 
Определение, однако, похоже на объявление, поскольку окружающий код не 
видит его, и оно не возвращает внедряемое значение, по которому можно ссы- 
латься на подпрограмму. 


• Если есть ВОСК без МАМЕ – это безымянное определение, т.е. анонимная подпро- 
грамма. Так как имя отсутствует, это вообще не обл.явление, а настоящий опе- 
ратор, возвращающий ссылку на тело анонимной подпрограммы на этапе вы- 
полнения. Это очень удобно для работы с кодом как с данными и позволяет рас- 
кидывать случайные фрагменты кода, чтобы использовать их как обратные 
вызовы, а может быть, даже как замыкания, если оператор определения $00 
ссылается на какие-либо внешние лексические переменные. Это значит, что 
различные вызовы одного и того же оператора ѕир будут вести бухгалтерию, 
необходимую для поддержания правильной «версии» каждой такой лексиче- 
ской переменной, которая существует в течение жизни замыкания, даже если 
начальная область видимости лексической переменной разрушена. 


В любом из этих трех случаев за МАМЕ и/или перед ВЕОСК может следовать аргумент 
РЯОТО или АТТЕН (или оба). Прототип – это список символов в круглых скобках, со- 
общающих анализатору, как обрабатывать аргументы функции. Атрибуты вво- 
дятся с помощью двоеточия и снабжают анализатор дополнительной информаци- 
ей о функции. Вот типичное определение, включающее все четыре поля: 


$6 питзгстр ($$) : 1оскед { 

ту ($а, $6) = @; 

геёигп $а <=> $6 || $а стр $0; 
} 


Подробные сведения о списках атрибутов и работе с ними приведены в описании 
директивы аїїгіриїеѕ в главе 29. См. также главу 1 и раздел «Анонимные подпро- 
граммы» главы 8. 


ѕиБѕїг ве) 


зибзтг ЕХРА, ОРЕЗЕТ, ГЕМСТН, ВЕРЬАСЕМЕМТ 
ѕирѕїг ЁХРА, ОРЕЗЕТ, ЁЕЕМСТН 
ѕирѕїг ЕХРА, ОРЕЗЕТ 


Функции Рей в алфавитном порядке 901 


Извлекает подстроку из строки, заданной выражением ЕХРА, и возвращает ее. 
Подстрока извлекается, начиная со смещения ОРЕЅЕТ символов от начала строки. 
Если ОҒЕЅЕТ меньше нуля, смещение отсчитывается от конца строки. Если длина 
[ЕМСТН опущена, возвращается все до конца строки. Если аргумент {ЕМСТН имеет 
отрицательное значение, длина подстроки рассчитывается так, чтобы оставить 
указанное число символов в конце строки. В противном случае / ЕМСТН определяет 
длину извлекаемой подстроки. как вы, наверное, и предполагали. 


Обратите внимание, что речь здесь идет о символах (т.е. о кодах), а не о байтах 
или графемах. Чтобы перейти к работе с байтами, сначала переведите строку 
в кодировку ОТЕ-8, а затем повторите попытку. Для работы с графемами исполь- 
зуйте метод ѕ0и№ѕїг из модуля Џпісоде: :СС5їгіпо, опубликованного в СРАМ. 


Функция $10${г может выступать в качестве левостороннего значения (которому 
можно присвоить значение). В этом случае выражение ЕХРЯ тоже должно быть ле- 
восторонним значением. Если присваиваемое значение короче, чем подстрока, 
длина строки уменьшится, а если длиннее, длина строки увеличится. Для сохра- 
нения прежней длины строки может потребоваться дополнить или усечь присваи- 
ваемое значение посредством ѕргіпїѓ или оператора х. При попытке присвоить что- 
либо невыделенной области за концом строки 3631г возбуждает исключение. 


Поместить перед строкой “І аггу" текущее значение $_ можно так: 
зибзтг($уаг, 0, 0) = “[аггу” 

А так можно заменить первый символ в $_ на “Мое”: 
зибѕїг($уаг, 0, 1} = Мое”; 


И наконец, замена последнего символа в $уаг на “Си у” выполняется следующим 
образом: 


ѕирѕїг(Фуаг, -1) = "Сиг1у”; 


Вместо использования ѕибѕіг в качестве левостороннего значения можно передать 
ей строку в четвертом аргументе ПЕРІАСЕМЕМТ. Это позволит заменить часть ЕХРА 
и получить прежнюю подстроку на этом месте одной операцией, как это делает 
ѕр1ісе. Следующий пример заменит последний символ в $\аг на "Сиу" и поместит 
его в $01051г: 


фо10ѕїг = зибзтг($уаг, -1, 1, “Сиг1у"); 


Не обязательно использовать 54031г как левостороннее значение только в случае 
присваивания. Следующий пример заменит все пробелы точками, но только 
в первых 10 символах строки: 


зибзтг($уаг, -10) =- 8/ /./9; 


Обратите внимание, мы продолжаем говорить о символах. Как и повсюду в этой 
книге, под символами подразумеваются коды, или символы, видимые програм- 
мисту, а не графемы, или символы, видимые пользователю. Графемы могут состо- 
ять из нескольких кодов каждая, что часто и происходит. Модуль Цп1соде: :ОС51гіпо 
из архива СРАМ предоставляет альтернативные функции, способные заменить 
стандартные ѕибзіг, 1пдех, роз и многие другие, которые оперируют логическими 
графемами, а не кодами. 


Если вы собираетесь использовать зи65г вместо регулярных выражений только 
потому, что, по вашему мнению, ѕибѕїг должна работать быстрее, вы удивитесь. 
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Зачастую регулярные выражения оказываются быстрее функции ѕибѕїг, даже 
при работе с полями фиксированной ширины. 


зутИпкК | 
ѕутІіпк ОЕРМАМЕ, МЕИМАМЕ 


Создает символическую ссылку МЕИМАМЕ на файл с именем 0/0МАМЕ. Возвращает ис- 
тинное значение в случае успеха и ложное в противном случае. В системах, не под- 
держивающих символические ссылки, возбуждает исключение на этапе выпол- 
нения. Чтобы проверить это, используйте еуа1 для перехвата возможной ошибки: 


$сап_ѕзутіпк = ема1 { ѕутііпк(”","") 1}; 


Либо обратитесь к модулю Сопѓід. Будьте осторожны при передаче относительной 
символической ссылки, поскольку она будет интерпретироваться относительно 
местоположения самой символической ссылки, а не относительно текущего рабо- 
чего каталога. 


См. также описания 1іпк и геад11пК выше в этой главе. 


ѕЅуѕсаіі [ТИ 


зузса11 Е1$Т 


Выполняет системный вызов (не команду интерпретатора), указанный в первом 
элементе списка, и передает оставшиеся элементы в качестве аргументов этого вы- 
зова. (Доступ ко многим из этих вызовов теперь стал легче благодаря таким моду- 
лям, как РО51Х.) Возбуждает исключение, если функция зузсаЦ(2) не реализована. 


Аргументы интерпретируются следующим образом: если аргумент представляет 
собой число, он передается как целое число языка С. Если нет, передается указа- 
тель на строку. Программист отвечает за то, чтобы строка имела достаточную дли- 
ну и могла принять любой результат, который может быть в нее записан; в про- 
тивном случае его ожидает аварийное завершение. Нельзя использовать строко- 
вой литерал (или другую строку, доступную только для чтения) в качестве аргу- 
мента ѕуѕса11, поскольку Ре] должен предполагать, что по любому указателю 
строки можно производить запись. Если целочисленные аргументы не являются 
литералами и никогда не интерпретировались в числовом контексте, может по- 
требоваться прибавить к ним 0, чтобы они выглядели как числа. 


5уѕса11 возвращает значение, которое вернул фактический системный вызов. По 
соглашениям программирования на С, если системный вызов завершается неуда- 
чей, 5уѕса11 возвращает -1 и устанавливает $! (номер ошибки). Некоторые систем- 
ные вызовы могут возвращать -1 в случае успеха. Правильный способ обработки 
таких вызовов состоит в приснаивании $!=0 перед вызовом и проверке значения 
$!, если функция 5уѕса11 вернула -1. 


Не ко всем системным вызовам можно обращаться таким способом. Например, 
Рег! поддерживает передачу системным вызовам до 14 аргументов, чего на прак- 
тике, как правило, достаточно. Однако не все гладко с системными вызовами, 
возвращающими несколько значений. Например, вызов ѕуѕса11(85Ү5 ріре) возвра- 
щает номер файла на читающем конце созданного им канала. Не существует спо- 
соба извлечь номер файла другого конца. Во избежание такого рода неприятно- 
стей можно обратиться к ріре. Чтобы решить проблему раз и навсегда, напишите 
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несколько ХЗОВ (модулей внешних подпрограмм, диалект С) для непосредствен- 
ного доступа к системным вызовам. Затем поместите свой новый модуль в СРАМ 
и станьте ужасно знаменитым. 


Следующая подпрограмма возвращает текущее время как число с плавающей за- 
пятой, а не целое число секунд, возвращаемое їіпе. (Работает только в системах, 
поддерживающих системный вызов ве Нтео]аау(2).) 


зиб Р1пе1те() { 
раскаде паіп; # для последующего геди1ге 
гедиіге “зузса11.рй”, 
# установить размер буфера для двух 32-разрядных 1опд.. 
пу $у - раск(” и", ()); 
зуѕса11(&5Ү5 деїї1тео?дау, $+у, ипдеР) >= 0 
|| діе "деїіітеоғдау $! “; 
му($зесопаз, $тісгоѕесопаѕ) = ипраск("1“, $їу); 
геїигп $ѕесопіѕ + ($тісгоѕесопаѕ / 1_000 000); 


} 


Предположим, что Рей не поддерживает системный вызов зеётоирз(2)!, а ядро 
поддерживает. Добраться до него можно таким способом: 


гедиу1ге ѕуѕса11.рһ”; 
ѕуѕса11(&5Ү5_ѕеїдгоирѕ, зса1аг @пему14$, раск(“1*”. @пемоійѕ)) 
|| 91е "ѕеїдгоирѕ: $!” 


Как сказано в инструкциях по установке Регі, если файл зузсаЙ.рВ отсутствует, 
может понадобиться запустить #2рй. В некоторых системах может потребоваться 
передать функции раск шаблон “ТТ”. Еще тревожнее, что ѕуѕса11 предполагает эк- 
вивалентность размеров С-типов 111, 10п0 и спаг*. Постарайтесь не считать ѕуѕса11 
образцом переносимости в миниатюре. 


Более строгий подход к задачам определения времени с более высоким разреше- 
нием реализован в модуле Т1те::Н1Вез из СРАМ. 


ТХ 
ѕуѕореп Тае, 
вуѕореп ЕТІ. ЕНАМРІ Е, ЕТІ ЕМАМЕ, МОРЕ, МАЅК 


зузореп ЕТЕЕНАМОЕЕ, ЕТІ ЕМАМЕ, МОВЕ 


Открывает файл с именем РІ! ҒМАМҒи связывает его с дескриитором файла РІ! ЕНАМ- 
ГЕ. Если РП ЕНАМІЕ является выражением, его значение используется как имя или 
ссылка на дескриптор файла. Если ЕИЕНАМИЕ является переменной с неопреде- 
ленным значением, необходимое значение будет создано автоматически. Возвра- 
щает истинное значение, если вызов успешен, и ложное – в противном случае. 


Эта функция является прямым интерфейсом к системному вызову операционной 
системы ореп(2), за которым следует библиотечный вызов {4ореп(З). По этой при- 
чине вам придется здесь немного прикинуться С-программистом. Возможные зна- 
чения и биты флагов параметра МОЕ доступны через модуль Есп{1. Поскольку 
в разных системах поддерживаются разные флаги, не рассчитывайте, что все они 
будут доступны в вашей системе. За подробностями обращайтесь к странице руко- 
водства ореп(2) или ее локальному эквиваленту. Тем не менее в любой системе, 


1 Хотя через $( поддерживает. 
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имеющей более-менее стандартную библиотеку С, должны присутствовать флаги, 
перечисленные в табл. 27.7. 


Таблица 27.7. Флаги для зузореп 


Значение 


0 АРОМУ Только для чтения 

0 МВОМІҮ Только для записи 

0 АРМА Чтение и запись 

0 СВЕАТ Создать файл, если он не существует 
0 ЕХСІ Ошибка, если файл уже существует 
0_АРРЕМО Дописывание в конец файла 

0 ТВИМС Усечение файла 


0 МОМВіОСК Неблокирующий доступ 


Однако существует множество других флагов. В табл. 27.8 перечислены некото- 
рые флаги, употребляемые реже. 


Таблица 27.8. Флаги для ѕуѕореп, употребляемые реже 


Значение 

О_МОЕГАҮ Старый синоним 0_МОМВЕОСК 

0_8ҮМС Вернуть управление, только когда данные физически будут записаны в уст- 
ройство. Можно также встретить 0_АЅҮМС, 0_05ҮМС и 0 АЅҮМС 

О_ЕХЕОСК Ғ1оск с помощью 10СК_ЕХ (только рекомендательная блокировка) 

0_$НЕОСК т1оск с помощью 10СК_5Н (только рекомендательная блокировка) 

0_ОТАЕСТОВУ | Вернуть ошибку, если файл не является каталогом 

0 М№-ОН0и | Вернуть ошибку, если последний элемент пути является символической 
ссылкой 

0_ВТМАВУ 61птоде дескриптора для систем Місгоѕоѓі. Иногда бывает определен 0_ТЕХТ, 


позволяющий включить противоположное поведение. 


О ГАНСЕРТЬЕЕ | В некоторых системах требуется для файлов, размер которых превышает 


2 Гбайт 


Открытие файла терминала не делает последний управляющим терминалом 
процесса, если у вас его еще нет. Обычно не требуется. 


0_МОСТТУ 


Флаг 0_ЕХСЕ не служит для блокировки: в данном случае исключительность озна- 
чает: если файл уже существует, вызов зузореп завершится неудачей. 


Если файл ЕТЕЕМАМЕ не существует, а М00Е содержит флаг 0_СВЕАТ, зузореп создаст 
файл, первоначальные права доступа к которому определяются аргументом МАЅК 
(или значением 0666, если этот аргумент отсутствует), с учетом текущей маски 
ипаѕк процесса. Такое значение по умолчанию разумно: читайте пояснения в опи- 
сании опазк. 


Дескрипторы файлов, открываемые с помощью ореп и ѕуѕореп, могут использо- 
ваться взаимозаменяемо. Нет необходимости применять зузгеад сотоварищи 
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только потому, что файл оказался открытым посредством ѕуѕореп, как этому не 
препятствует и открытие его посредством ореп. Каждая из функций может делать 
то, чего не умеет другая. Обычная функция ореп может открывать каналы, запус- 
кать процессы, добавлять фильтры ввода/вывода, дублировать дескрипторы фай- 
лов и преобразовывать численные указатели файлов в дескрипторы файлов. Она 
также игнорирует ведущие и замыкающие пробельные символы в именах файлов 
и почитает «э за специальное имя файла. Однако что касается фактического от- 
крытия файлов, зузореп умеет делать то же, что и ореп. 


В следующих примерах приведены эквивалентные вызовы обеих функций. Для 
ясности мы опустили проверки ог 0іе $!, но в своих программах всегда проверяй- 
те возвращаемые значения. Мы ограничимся использованием только флагов, 
доступных практически в любых операционных системах. Следите за значения- 
ми, объединяемыми поразрядным оператором | и передаваемыми в качестве ар- 
гумента МОРЕ. 


• Открыть файл для чтения: 


ореп(ЕН, ~ , Фрай); 
зузореп(ЕН, Ф$раїһ, 0_ВООМІҮ); 


• Открыть файл для записи. При наобходимости создать новый файл или усечь 
старый: 


ореп(ЕН, ">", $ра+ћһ); 
ѕуѕореп(ЕН, $раїһ, 0 МАОМІҮ | О ТА0МС | 0_СВЕАТ); 


• Открыть файл для дописывания. При необходимости создать его: 


ореп(ЕН, ">>", $раїһ); 
ѕуѕореп(ЕН, Фраїп, 0 ИВОМУ | О_АРРЕМО | О САБАТ): 


• Открыть существующий файл для обновления: 


ореп(ЕН, “+<”, Фратћ); 
зузореп(ЕН, Фраїћ, О ВОМА), 


А вот что можно делать с помощью ѕуѕореп, но нельзя с помощью обычной ореп: 


• Открыть и создать для записи файл, который не должен предварительно су- 
ществовать: 


зузореп(ЕН, Фраїһ, О МВОМҮ | О ЕХСІ | О СЕАТ); 

• Открыть для дописывания файл, который должен уже существовать: 
ѕуѕореп(ЕН, Фрати, О МАОМҮ | 0_АРРЕМО); 

• Открыть для обновления файл, создать при необходимости новый: 
ѕуѕореп(ЕН, Фрати, 0_ВОИЯ | О СВЕАТ); 


• Открыть для обновления файл, который не должен предварительно существо- 
вать: 


ѕуѕореп(ЕН, Фраїһ, О АОМВ | О ЕХСи О _САЕАТ); 


• Открыть файл только для записи без блокировки, но не создавать, если он не 
существует: 


ѕуѕореп( ЕН, Фраїһ, 0 МОМУ | О МОМВІОСК); 
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Модуль 10::Ғі1е предоставляет группу объектно-ориентированных синонимов 
(плюс небольшое число новых функций) для открытия файлов. Соответствую- 
щие методы из 10::Ғі1е или 10::Нап01е можно вызывать с любым дескриптором, 
созданным посредством ореп, зузореп, ріре, ѕоскеї или ассерї, даже если эти де- 
скрипторы были инициализированы без использования данного модуля. Факти- 
чески, теперь Рег] загружает эти модули неявно, чтобы обеспечить доступ к этим 
функциям. 


зузгеад ет 


зузгеаа А ЕНАМг Е, ЅСАГАН, гЕМаТН, ОРЕЗЕТ 
Ѕуѕгеаа ЕІ ЕНАМОІ Е, ЅСАГАВ, ЕЕМСТН 


Пытается прочесть [ЕМСТН символов в переменную САГАН из указанного ЕІ ЕНАМІЕ 
посредством системного низкоуровневого вызова ге20(2). Возвращает число про- 
читанных символов, 0 при достижении ЕОЕ! или ипе? в случае ошибки. ЗСАГАВ 
будет расти или сокращаться в соответствии с количеством прочитанных симво- 
лов. Смещение 0ЕЕ5Е7, если задано, указывает, в какое место строки начать поме- 
щать символы, поэтому чтение можно производить в середину строки, которой 
отводится роль буфера. Пример использования 0РЕЗЕТ вы найдете в описании 
функции зузимг Це. Если аргумент [ЕМСТН имеет отрицательное значение или ОРЕЅЕТ 
указывает позицию за пределами строки. возникает исключение. 


Если дескриптор файла не включает фильтр ввода/вывода, отвечающий за коди- 
рование символов, коды прочитанных символов не превышают значения 255, т.е. 
фактически выполняется чтение байтов. 


Будьте готовы решать возникающие проблемы (такие, как прерванные систем: 
ные вызовы), которые обычно обрабатывает стандартная система ввода/вывода. 
Поскольку ѕуѕгеад выполняет операции в обход стандартной системы ввода/выво- 
да, не смешивайте ее с другими функциями чтения, ргіпї, ргіпї?, мгіїе, зеек, їе11 
или еоѓ в работе с одним и тем же файловым дескриптором, если только вы не за- 
интересованы в сильнодействующем колдовстве (и/или головной боли). Имейте 
также в виду, что при чтении файла, содержащего символы в кодировке ОТЕ-8, 
ОТЕ-16 или любой другой многобайтной кодировке, граница буфера может по- 
пасть на середину символа. Поэтому лучше заранее установить кодировку и вы- 
полнять чтение посимвольно, а не побайтно. 

Обратите внимание, что если дескриптор файла помечен как :иї#8, вместо бай- 
тов будет выполняться чтение символов Юникода ([ЕМСТН, ОРЕЅЕТ и возвращаемое 
значение функции зузгеад будут выражаться в символах Юникода). Фильтр 
:епсой1п0(...) неявно включает и фильтр :и1+8. 


ИХ 
ѕуѕѕеек 19 104 
ѕуѕѕеек ЕТЁЕЕНАМОЕЕ, РОЗТТТОМ, ИНЕМСЕ 


Устанавливает системную позицию ЕПЕНАМЕЕ с помощью системного вызова 
13ееЁ (2). Операция выполняется в обход стандартной системы ввода/вывода, 


* Функции ѕуѕеоѓ нет, и это нормально, поскольку еоѓ в любом случае не очень хорошо 
работает с файлами устройств (например, с терминалами). Используйте ѕуѕгеаб и срав- 
нивайте возвращаемое значение с 0, чтобы определить конец файла. 
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поэтому, смешивая ее с операциями чтения (отличными от зузгеад), ргіпї, м"Це, 
ѕеек, їе11 или еоѓ, вы можете нажить неприятности. РІП ЕНАМІЕ может быть выра- 
жением, возвращающим имя дескриптора файла. Возможные значения ИНЕМСЕ: 0 
устанавливает новую позицию РОЅІТІОћ, 1 устанавливает позицию в РОЗТТТОК отно- 
сительно текущей позиции, и 2 устанавливает позицию в ЕОЕ плюс РОЗТТТОМ (обыч- 
но отрицательную). Значением ИНЕМСЕ могут быть константы ЗЕЕК_5Е1, ЭЕЕК_СУВ 
и ЅЕЕК_ЕМ№ из стандартных модулей 10::5еекаб1е, РОЗТХ или Есп{1; константы более 
переносимы и более удобны. 


Возвращает новую позицию в байтах или ипдет – в случае неудачи. Нулевая пози- 
ция возвращается в виде особой строки "0 Бит їгие”, которая может использовать- 
ся как число, не вызывая вывода предупреждений и не требуя использования 
// діе вместо более привычного || 091е 


Внимание: аргумент РОЗТТТОМ определяет значение позиции в байтах, а не в симво- 
лах, независимо от того, задействован ли в дескрипторе файла какой-либо фильтр 
ввода/вывода для декодирования. Однако все функции Рег], выполняющие чте- 
ние файлов, используют тот или иной фильтр кодирования/декодирования, пото- 
муесть вероятность прочитать часть «символа» и получить недопустимую строку. 
Старайтесь не смешивать вызовы ѕуѕѕеек или ѕеек с функциями ввода/вывода при 
работе с дескрипторами файлов. предусматривающими обработку многобайтных 
кодировок. 


ѕуѕїегт Я 


Ѕуѕёет РАТНМАМЕ {1 ТЅТ 
Ѕѕуѕтет [15Т 


Выполняет любую программу в системе и возвращает код ее завершения (вместо 
вывода). Чтобы перехватить вывод команды, используйте обратные апострофы 
или 4х//. Функция ѕуѕіеп действует так же, как ехес, за исключением того, что 
ѕуѕїеп сначала выполняет Гогк, а затем, после ехес, ждет завершения выполняе- 
мой программы. Это значит, что она запускает указанную программу и возвра 
щается по ее завершении, тогда как ехес заменяет выполняемую программу но- 
вой и уже не возвращается, если замена прошла успешно. 


Обработка аргументов зависит от их количества; алгоритм этой обработки приве- 
ден в описании ехес, включая определение необходимости вызова интерпретатора 
команд и попытки обмана программы относительно ее имени указанием отдель- 
ного РАТНМАМЕ, 


Поскольку ѕуѕтеп и обратные апострофы блокируют $1611 и 5160017, отправка од- 
ного из этих сигналов (например, от Сопіго!-С) выполняемой программе не преры- 
вает основную программу. Но другая программа, которую вы выполняете, полу- 
чит сигнал. Проверяйте значение, возвращаемое ѕуѕїет, чтобы знать, заверши- 
лась ли запущенная вами программа корректно. 


@агоз = ("сотпапа”, “агд1”, “аго2”), 
ѕуѕзїет(@агдѕ) == 0 
|| діе “зузтет @агдз Ғаі1еа: $2” 


Возвращаемое значение представляет собой код завершения программы, полу- 
ченный системным вызовом шай(2). В традиционной семантике для получения 
реального кода завершения нужно разделить полученное значение на 256 (или 
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сдвинуть вправо на 8 разрядов). Дело в том, что в младшем байте есть кое-что еще. 
(В действительности два кое-чего.) Младшие семь разрядов содержат номер сигна- 
ла, прервавшего процесс (если он был получен), а восьмой бит указывает, был ли 
сохранен дамп памяти процесса. Можно проверить все варианты ошибок, вклю- 
чая сигналы и дамп памяти, исследовав значение переменной $? (ФСНІІ О _ЕААОВ): 


фехії уа1ие = $? >> 8; 
$519па1 пит = $? & 127; # или 0х7#, или 0177, или 000111_1111 
$Читред_соге = $? & 128; # или 0х80, или 0200, или 061000_0000 


Если программа запущена через системный интерпретатор команд: вследствие 
того, что единственный аргумент содержит метасимволы интерпретатора, обыч- 
ные коды возврата подвергаются воздействию специфических особенностей и воз- 
можностей этого интерпретатора. Иными словами, в этом случае вы можете ока- 
заться не в состояний восстановить подробную информацию, как описано ранее. 


у ХХ 
ѕЅуѕугіќе $1 150 Анн 
ѕуемгіте ЕМЕНАМОЕЕ, ЅСАГАН, ГЕМСТН, ОРҒЅЕТ 


ѕуѕмгі се ЕТЁЕЕНАМОЕЕ, ЅСАГАВ, ГЕМТН 
ѕуѕигіїе ЕЛЕЕНАМОЕЕ, ЅСАГАВ 


Пытается записать / ЕМСТН байтов из переменной 5СА!АВ в указанный ЕТЕЕНАМУЕ по- 
средством системного вызова ит е(2). Возвращает число записанных байтов или 
упаде? - в случае ошибки. Смещение ОРР5ЕТ, если задано, указывает. с какой пози- 
ции в строке начать запись. (Это может понадобиться при использовании строки 
как буфера или если возникнет необходимость восстановления при частичной за- 
писи.) Отрицательное смещение ОҒЕЅЕТ указывает, что запись должна начаться 
с позиции, отсчитанной от конца строки. Если строка 5СА!АВ пустая, допустимо 
только значение ОҒЕ5ЕТ, равное 0. Если аргумент [ЕМСТ/ имеет отрицательное зна- 
чение или ОҒҒЅЕТ указывает позицию вне строки, возникает исключение. 


Чтобы скопировать данные из дескриптора файла ҒАОМ в дескриптор файла Т0, 
можно сказать: 


џѕе Еггпо дм/ЕТМТВИ, 
$01к5іғе = (ЅѕТаї ҒВОМ)Е11] || 16384; # предпочтительный размер блока? 
мһі1е ($1еп = ѕуѕгеад РВОМ, $00#, $61К$12е) { 
1 (!деғіпеа $1еп) { 
пех ЇР $! == ЕІМТА; 
діе “Системная ошибка чтения: $! "; 
} 
$огғѕе? = 0; 
мһі1е ($1еп) { + Обработка неполной записи. 
фигіїтеп = ѕуѕигіїе 10, $0иғ, $1еп, $оҒтѕеї, 
91е “Системная ошибка записи: $!" ип1еѕѕ деғіпей $мг1 еп; 
фоғғѕеї += $игіїтеп; 
$1еп -= Фиг еп: 


і По определению это /Біп/ѕћ или соответствующий эквивалент для вашей платформы, 
но не тот интерпретатор, под управлением которого в данный момент работает пользо- 
ватель. 
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Следует подготовиться к решению возможных проблем, например, при частич- 
ной записи. Поскольку ѕуѕигіїе выполняет запись в обход стандартной библиоте- 
ки ввода/вывода С, не смешивайтеее вызовы с операциями чтения (кроме зузгеад), 
записи (например, ргіпї, рг1п ТР или мгіїе) или другими функциями стандартного 
ввода/вывода, такими как 566К, їе11 или еоТ, если только вы не заинтересованы 
в сильнодействующем колдовстве.! 


Обратите внимание, что если для дескриптора файла активен фильтр :иї#8, вме- 
сто байтов будет выполняться запись символов Юникода в кодировке ОТЕ-8, 
а значения ГЕМТН, ОЕЕЗЕТ и возвращаемое значение функции ѕуѕгеас будут выра- 
жаться в символах Юникода (в кодировке ОТЕ-8). Фильтр :епсой1по(...) неявно 
активизирует фильтр :иї#8. 


че! (акс 


1е11 ЕТІ ЕНАМІЕ 
їе11 


Возвращает текущую позицию в файле (в байтах, отсчет с нуля) для ЕТШЕНАМОЕЕ. 
Обычно это значение затем передается на вход функции зеек, чтобы вернуться 
к текущей позиции. ЕП ЕНАМОЕЕ может быть выражением, возвращающим имя те- 
кущего дескриптора файла, или ссылкой на объект дескриптора файла. Если ар- 
гумент ЕП ЕНАМІ Е опущен, возвращается позиция в файле, из которого последний 
раз осуществлялось чтение. Позиции в файле имеют смысл только для обычных 
файлов. Для устройств, каналов и сокетов позиция в файле не существует. 


Обратите внимание на слова «в байтах»: даже если дескриптор файла настроен 
на работу с символами (например, был включен фильтр :епсобіпо(иї#8)), +е11 все- 
гда возвращает смещения в байтах, а не в символах (потому что иначе функции 
зеек и +е11 выполнялись бы чрезвычайно медленно). 


Функции 5у31е11 не существует. Используйте для этой цели зуззеек(ЕН, 0, 1). 
См. пример вызова їе11 в описании еек. 


Не используйте 1011 (или любую другую операцию буферизованного ввода/выво- 
да) с дескрипторами файлов, если к ним применялись функции ѕуѕгеай, зузиг Те 
или зуззеек. Эти функции игнорируют буферизованный ввод/вывод, а {е11 – нет. 


їеПаіг МІ! 
{е1191г ОТАНАМОЕЕ 


Возвращает текущую позицию после вызова геабдіг с дескриптором каталога 
ОТВНАМОЕЕ. Это значение можно передать ѕеекдіг для доступа к конкретному месту 
в каталоге. Для этой функции действуют те же предостережения о возможном 
сжатии каталога, что и для соответствующей программы системной библиотеки. 
Функция может быть реализована не везде, где есть геаййіг. Даже если она реали- 
зована, возвращаемое значение нельзя использовать в расчетах. Это не вполне 
прозрачное значение, имеющее смысл только для ѕеекаіг. 


1 Илиголовной боли. 
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Че #8) 


іе УАРТАВЕЕ, СІАЅЅМАМЕ. Е15Т 


Связывает переменную с классом пакета, который обеспечивает реализацию 
этой переменной. УАРТАВЕЕ — переменная (скаляр, массив или хеш) или +урес1оЬ 
(представляющий дескриптор файла) для связывания. (1А55ЛАМЕ – имя класса, 
реализующего объекты надлежащего типа. 


Любые дополнительные аргументы передаются соответствующему конструктору 
класса с именем ТТЕЗСАЕАВ, ТТЕАВВАУ, ТТЕНАЗН или ТТЕНАМОГЕ. (Если требуемый конст- 
руктор не найден, возникает исключение.) Обычно это те аргументы, которые мо- 
гут быть переданы в функцию С 4бт_ореп(3}, но их значение зависит от пакета. 
Объект, возвращаемый конструктором, в свою очередь возвращается функцией 
Не, что может пригодиться для обращения к другим методам в СЕАЗЗМАМЕ. (Доступ 
к объекту может также осуществляться через функцию 1160.) Поэтому класс для 
связывания хеша с реализацией І5АМ может предоставлять дополнительный ме- 
тод для последовательного обхода множества ключей («9» в аббревиатуре ЗАМ 
означает «ведиеп а!» — «последовательный»), поскольку обычная реализация 
ОВМ может этого не делать. 


Такие функции, как Кеуз и уа1иез, могут возвращать огромные списки, если ис- 
пользуются с такими большими объектами, как файлы ОВМ. Для их обхода 
предпочтительнее использовать функцию еасн. Например: 


џѕе МОВМ_Е11е; 
{1е(%АЕТАЗЕ$, “МОВМ_Е11е”, “/етс/а11азез", 1, 0) 
Н біе "Невозможно открыть псевдонимы: $! “; 
мһі1е (($Кеу, $%а1) = еасһ %АЕТАЗЕЗ) { 
зау “$кеу = $уа!”; 
} 
ипеіе ЖАі ТАЅЕЅ; 


Класс, реализующий хеш, должен предоставлять следующие методы: 


ТІЕНАЅН СІ455, 11757 
РЕТСН БЕГА, КЕУ 
ЅТОВЕ ЅЕЁР, КЕУ, ИАШЕ 
ОЕГЕТЕ 5ЕЁР. КЕУ 
СТЕАН ЕГА 

ЕХТ$Т$ РГР, КЕУ 
ЕТАЗТКЕУ ЗЕЁР 
МЕХТКЕҮ ЕГА, ГАЗТКЕУ 
САГАА ЕГЕ 

ОЕЗТАОУ 5ЕЁР 

УМТТЕ 5ЕЁР 


Класс, реализующий обычный массив, должен предоставлять следующие методы: 


ТТЕААВАУ С1А55, Е15Т 
РЕТСН $ЕЁР, КЕУ 

ТОНЕ $ЕЁЕ, КЕҮ, УАШЕ 
РЕТСНЅІЈЕ $ЕТЕ 
ЅТОВЕЅІЛЕ РГР, СОИМТ 
СІЕАВ ЕЕ 

РИЅН ЕГА, [ІТ 
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РОР 5ЕЁЕ 

ЭНТЕТ ЕГЕ 

УМ$НТЕТ $ЕЁР, ЕТ5Т 

ОРЕТСЕ $ЕЁР, ОҒЕЅЕТ, ЕЕМСТН, ІІТ 
ЕХТЕМО 5ЕЁР, СОИМТ 

РЕЗТНОУ 5ЕЁР 

УМТТЕ $ЕЁР 


Класе, реализующий скаляр, должен предоставлять следующие методы: 


ТТЕЗСАЕАЯ С/455, ЕТ5Т 
РЕТСН 5ЕЁР, 

ЭТОНЕ 5ЕЁР, МАШЕ 
ОЕЅТАОҮ ЕЕ 

ИМТТЕ 5ЕЁЕ 


Класс, реализующий дескриптор файла, должен предоставлять следующие ме- 
тоды: 


ТТЕНАМОГЕ СЁ4$$, #19Т 

АЕА 5ЕЁР, ЗСАРАВ, ГЕМСТН, ОРЕЗЕТ 
НЕАОЕТМЕ ЅЕ/Р 

СЕТС ЗЕЁЕР 

ИВТТЕ 5ЕЁР, ЗСАЁАВ, ГЕМСТН, ОРРЅЕТ 
РАТМТ 5ЕЁР, 1157 

РАТМТЕ 5ЕЁЕ. РОВМАТ, ЕТ5Т 
ВІММОВЕ $ЕЕР 

ЕОЕ ЗЕЕ 

ЕТЕЕМО $ЕТЕ 

ЗЕЕК $ЕЁЁ, РОЗТТТОМ, ИНЕМСЕ 

ТЕЦ. ЗЕЁЕ 

ОРЕМ 52/2, МОБЕ, ЕТ5Т 

СІ0ЅЕ $ЕЁР 

БЕЗТВОУ 5ЕЁР 

ОМТТЕ $ЕЁР 


Не все перечисленные выше методы требуется реализовывать: модули Тіе::Наѕћ, 
Тіе::Аггау, Т1е::Зса1аг и Тіе::Напд1е предоставляют базовые классы с приемлемыми 
методами по умолчанию. Подробное обсуждение этих методов вы найдете в гла- 
ве 14. В отличие от дбпореп, функция їіе не станет загружать модуль через џѕє или 
гедиіге — программист должен сделать это сам, явно. Интересные реализации їіе 
можно найти в модулях 0В Гі1е и Сопѓід. 


беа 
т160 МААТГАВІЕ 


Возвращает ссылку на объект, лежащий в основе скаляра, массива, хеша или 
{уреғ1оЬ, содержащихся в УАРТАВЕЕ (то же значение, которое первоначально воз- 
вращалось вызовом їіе, связавшим переменную с пакетом). Возвращает неопре- 
деленное значение, если УАВТАВЕЕ не привязана к пакету. Поэтому, например, 
можно использовать: 


ге? 11е0 Жһаѕһ 


чтобы определить пакет привязки вашего хеша. (Если вы забыли.) 
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{те 
їіпе 


Возвращает число секунд без учета високосных лет после «начала эпохи», обычно 
это 00:00:00 1 января 1970 года, ОТС (Опіуегѕаі Соогаштае@ Тіте).! Возвращае- 
мое значение можно передать функции иїіпе, атакже функциям дпііпе и 10оса {1те 
для сравнения с временем модификации файла и доступа к файлу, полученных 
от Ѕїаї. 


$ѕтагт = т1пте(); 

ѕуѕїтет( "некая медленная команда“); 

$епа = їіпе(); 

1Ё ($епа - $этаг{ > 1) { 
ѕау "Программа запущена : ”, ѕса1аг 1оса1їіте(%фѕїаг+); 
зау “Программа завершилась. “, ѕса1аг 1оса1їіте($епа), 


} 


Для измерения интервалов времени с более высокой точностью, чем целое число 
секунд, используйте модуль Т1те: :Н1Вез, входящий в состав дистрибутива Рег] на- 
чиная с версии у5.8 и доступный в СРАМ для более ранних версий. 
{тез К 
[0] 
Тіпеѕ 


В списочном контексте возвращает список из четырех элементов, которые дают 
время в секундах (возможно, дробное) работы СРО в пространстве пользователя 
и в пространстве ядра, для данного процесса и его завершившихся порожденных 
процессов. 


($иѕег, $ѕуѕ%ет, $сиѕег, $сзузтет) = Тітеѕ(); 
ргіпі? “Данный рід и его потомки использовали %.3Р секунд\п”, 
$иѕег + $зузтем + фсиѕег + $сзузТеп; 


В скалярном контексте возвращает толькс время работы в пространстве пользо- 
вателя. Например, для измерения времени выполнения фрагмента кода Регі: 


фэтагт = тлтез(); 
$епа = 11тез(); 


ргіпі? "Это заняло %.2Р секунд в пространстве пользователя\п”, 
фена - $зтагт; 


1/// ко 


ГИ 
у/// 


Это оператор транслитерации (иногда по ошибке его называют оператором транс- 
ляции), подобный оператору у/// в программе ОМХ ѕей, только лучше, по всеоб- 
щему скромному мнению. См. главу 5. 


1 Не путать с «эпопеей», что относится к созданию ОМІХ. (У других операционных сис- 
тем могут быть другие эпохи, не говоря уже о других эпопеях.) 
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Чтобы работать со значением, доступным только для чтения, не опасаясь исклю- 
чений, используйте модификатор /г, впервые появившийся в версии у5.14. 


зау “БооККеерег” =- іг/боер/реоб/г; # выведет “рееккообог“” 


їгипсаїе ЕТТЕ 


їгипсате Е ЕНААРІЕ, ІЕМСТН 
{гопсаЕе ЕХРА, ЕЕМСТН 


Усекает файл, открытый в ЕП ЕНАМИЕ или заданный именем в ЕХРА, до указанной 
длины. Возбуждает исключение, если ѓѓгипсаіе(2) или его эквивалент не реали- 
зованы в данной системе. (Усечение файла всегда можно произвести, скопировав 
его начало, при наличии достаточного дискового пространства.) Возвращает ис- 
тинное значение в случае успеха и џпіеѓ в противном случае. 


Поведение функции не определено, если значение /ЕМСТН окажется больше теку- 
щей длины файла. Однако в традиционных файловых системах для ОШХ длина 
файла увеличивается до указанного значения. а «несуществующие данные» воз- 
вращаются ядром в виде нулевых байтов. 


Позиция чтения/записи в файле ЕИЕНАМИЕ не изменяется. После усечения файла 
может потребоваться вызвать функцию зеек перед записью. 


ис 5. [т] 


ис ЕХРВ 
ис 


Возвращает версию ЕХР® в верхнем регистре. Это внутренняя функция, реализую- 
щая езсаре-последовательность \ в интерполируемых строках. Для перевода 
в заглавный регистр используйте функцию ис{1гзт. 


Не используйте ис для реализации сравнения без учета регистра символов, как, 
возможно, вы делали это при работе со строками АЗСП, потому что для строк 
Юникода этот прием дает неверный результат. Для этих целей лучше либо исполь- 
зовать функцию їс (выполняющую свертку регистра) из модуля Џпісобе::СаѕеҒо1іа 
в СРАМ, либо задействовать прагму изе Театиге “Рс” в Рей версии у5.16 и более 
поздних. Дополнительные сведения можно найти в разделе «Ошибочные пред- 
ставления о регистре» главы 6. 


Функция ис игнорирует коды символов в диапазоне 128-256, если к строке не 
применяется семантика Юникода (и не действует режим национальных настро- 
ек), о чем трудно догадаться. Особенность ип1соде_31г1п9$ гарантирует включение 
семантики Юникода даже для этих кодов. См. главу 6. 


исіїгѕ? [т] 


ис?ігої ЕХРЯ 
исТігбї 


Возвращает версию ЕХРЯ, в которой первые символы слов переведены в заглавный 
регистр, а остальные символы не изменяются. Заглавный регистр — это регистр 
начальной прописной буквы, за которой следуют (предположительно) буквы 
в нижнем регистре. Такой регистр используется, например, в первом слове пред- 
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ложения, в имени человека, в газетном заголовке, а также в большинстве слов на- 
звания книги!. Символы, не имеющие заглавного регистра, преобразуются в верх- 
ний регистр. Это внутренняя функция, реализующая езсаре-последовательность 
\и в строках, заключенных в двойные кавычки. 


Например, если поместить символ О+ЕВ02 1 АТІМ МАШ |ТСАТИВЕ ЕІ в начало слова 
«Пожмег» (т.е. “\х{РВО2}омег”) и поставить это слово первым в предложении, после 
перевода в заглавный регистр будет получено слово «Ео\ег», а не «ЕГо\мег». Од- 
нако в результате перевода в верхний регистр будет получено слово «Е.ОУЕБ». 


Перевести первый символ в заглавный регистр, а все остальное ~ в нижний мож- 
но так: 


исеігѕ(ѕибѕіг( мога, 0, 1)) 1с(ѕирѕіг ($мога, 1)) 
Не используйте 
исРігѕї 1с $мога 


(разве что вам симпатичен культурный империализм) или “\\1$мога", потому что 
для некоторых символов может быть получен неверный результат. Результат пе- 
ревода в заглавный регистр символов, переведенных ранее в нижний регистр, не 
всегда совпадает с результатом перевода в заглавный регистр исходных символов. 


Поскольку заглавный регистр имеет смысл только для первого символа в строке, 
за которым следуют символы нижнего регистра, мы не видим каких-либо при- 
чин, оправдывающих перевод в заглавный регистр всех символор в строке. И все 
же покажем, как это сделать: 


$87109 =- 5/ ( (2= \р{Сит} ) \Х ) /\и91/9х; 


Свойство СИТ, использованное здесь, имеет полноеимя Сһапдеѕ_Мћеп_Тії1есаѕед=Тгие, 
но его слишком долго вводить с клавиатуры, поэтому и было выбрано официаль- 
ное сокращение. 


См. в описании ис замечания, касающиеся особенности ипісоде_ѕігіпоѕ. 


итаѕк Е 


итазк ЕХРЕ 
иутазкК 


Устанавливает пользовательскую маску режима доступа создаваемых процессом 
файлов и возвращает ее прежнее значение, используя системный вызов ита5Ё(2). 
Маска сообщает операционной системе, какие биты прав доступа отключать 
при создании новых файлов, в том числе каталогов. Если аргумент ЕХРА опущен, 
функция просто возвращает текущую маску. Например, чтобы разрешить биты 
прав доступа для «владельца» и сбросить биты прав доступа для «других», попро- 
буйте что-нибудь вроде: 


итазк( (итазк() & 077) | 7): # не изменять биты группы 


Помните, что маска представляет собой число, обычно задаваемое в восьмерич- 
ном виде, а не строку восьмеричных цифр. Если же у вас есть только строка. об- 


1 Имеется в виду англоязычная традиция, где каждое слово в названии книги, кроме 
артиклей и союзов, принято начинать с заглавной буквы. — Прим. перев. 
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ратитесь к функции осї. Помните также, что биты маски являются дополнения- 
ми для обычных разрешений. 


Права доступа ОМХ гихг-х--- представляются как три группы по три бита или 
три восьмеричные цифры: 0750 (ведущий 0 указывает, что это восьмеричное чис- 
ло, и не считается за цифру). Поскольку биты прав доступа в маске перевернуты, 
она представляет выключенные биты разрешений. Значения прав доступа (или 
«режима»), передаваемые пКО1г или ѕуѕореп, модифицируются маской пользова- 
теля, поэтому даже если потребовать от зузореп создать файл с режимом 0777, при 
маске пользователя 0022, файл будет создан с правами доступа 0755. Если маска 
равна 0027 (группа не может писать; остальные не могут читать, писать или вы- 
полнять), вызов зузореп с маской МАЗК, равной 0666, создаст файл с режимом 0640 
(поскольку 0666 & -0027 равно 0640). 


Вот некоторые советы: указывайте режим создания 0666 для обычных файлов 
(в зузореп) и 0777 для исполняемых файлов и каталогов (в пкдіг). Это дает пользо- 
вателям свободу выбора; если им нужны защищенные файлы, они выбирают 
маску процесса 022, 027 или даже особенно асоциальную маску 077. Программам 
навряд ли следует возлагать на пользователя принятие решения относительно 
политики безопасности. Исключением из этого правила служат программы, осу- 
ществляющие запись в файлы, которые должны быть закрытыми: почтовые фай- 
лы, «куки»-файлы веб-браузера, файлы .гйоз{8 и т.д. 


Если системный вызов и7а$#(2) не реализован в системе, при попытке ограни- 
чить свой собственный доступ (т.е. (ЕХРА & 0700) > 0) на этапе выполнения возник- 
нет исключение. Если вызов итазЁ(2) не реализован, и вы не пытаетесь ограни- 
чить свой собственный доступ, функция просто вернет ипдет. 


т 
ипаеѓ# 11 


ипдеғ ЕХРВ 
ипаеғ 


ипбеР — это имя, которым мы обозначаем абстракцию, известную как «неопреде- 
ленное значение». По удачному стечению обстоятельств оно также является име- 
нем функции, которая всегда возвращает неопределенное значение. Мы благопо- 
лучно смешиваем одно с другим". 


По некоторому совпадению функция ипае{ может также явно сделать неопреде- 
ленным объект, если передать его имя в качестве аргумента. Аргумент ЕХРА, если 
присутствует, должен быть левосторонним значением. Поэтому применять функ- 
цию можно только к скалярной величине, массиву или хешу целиком, имени 
подпрограммы (с префиксом &) или фуре?10Ъ. Память, занимаемая объектом, ос- 
вобождается, и может повторно использоваться (хотя в большинстве операцион- 
ных систем она не возвращается в систему). Для большинства специальных пере- 
менных действие функции ипдеф, вероятно, обманет ваши ожидания. Передача 
этой функции переменной, доступной только для чтения, такой как $1, возбужда- 
ет исключение. 


1 Сдругой стороны, Регі 6 благополучно наводит порядок в ипде? и смешивает другие по- 


нятия. 
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Функция ипде! является унарным оператором, а не списочным, поэтому сделать 
неопределенным можно только одно значение за раз. Вот несколько примеров ис- 
пользования ипіеї как унарного оператора: 


опаде? $Ғоо; 

ипдеғ $Баг{“61иг{1”}; # Не то же, что де1еїе $баг{ “б1ог?1”}; 

ипае? @агу; 

ипаеї паз, 

опаде? ётуѕиб; 

опаде? «хуг; # разрушит $хуг, @луг, хуг, ёхүг и так далее. 


ипде? без аргумента используется как простое значение: 


ѕзе1есї(ипдеѓ, ипдеѓ, ипдеѓ, Фпарїіте); 


гетигп (мапфаггау ? () : ипдеР) 1? $1ћеу Б1ем ії; 
гетиго 1? фЕћеу б1ем 1ї; # то же самое 


ипдег может выступать в качестве заполнителя в левой части присваивания спи- 
ску, тогда соответствующее значение в правой части просто отбрасывается. В дру- 
гом качестве использовать ипіеѓ как левостороннее значение нельзя. 


($а, $6, ипдеғ, $с) = &Ғоо, # Игнорировать третье возвращаемое значение 


Кроме того, не пытайтесь сравнивать что-либо с ипдег – получится не то, что вы 
думаете. Сравнение будет выполнено с 0 или пустой строкой. Выяснить, опреде- 
лено ли значение, можно посредством функции де11пе0 или оператора //. 


ипйпк $ ЕЕ 


ип] фак 2757 
ип] 17К 


Удаляет файлы, перечисленные в списке!. Возвращает число удаленных файлов. 
Например: 


фсоџп = ип1іпк("а", "6", с”), 
ип1іпк @допег$; 
ип1іпк 9106(”»* огід”), 


Функция ип1іпк не станет удалять каталоги, если вы не являетесь суперпользова- 
телем и Регі запущен без ключа командной строки -{/. Помните, что даже если 
оба эти условия выполнены, удаление каталога таким способом может нанести 
Серьезный Ущерб файловой системе. Используйте для этих целей гпііг. 


Вот простая команда гт с очень простым контролем ошибок: 


#1 /иѕг/б1п/рег1 
@саппої = дгер {пої ип1іпк} @АЯбУ; 
діе "$0: невозможно выполнить ип1іпк @саппої" 1? @саппо+; 


1 Фактически в файловой системе РОЅІХ она удаляет записи из каталога (имена фай- 
лов), которые ссылаются на реальные файлы. Поскольку ссылка на файл может суще- 
ствовать в нескольких каталогах, файл будет удален только после удаления последней 
ссылки на этот файл. 
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ипраск 


оипраск ТЕМЕЕАТЕ ЕХРЕ 


Оказывает действие, обратное раск: распаковывает строку (ЕХРА), представляю- 
щую структуру данных, в список значений согласно шаблону ТЕМРІАТЕ и возвра- 
щает эти значения. Шаблоны функций раск и ипраск описываются в главе 26. 


ип ле 


ила РЕ ААВАУ, Е15Т 


Выполняет действие, противоположное $1111. (Или противоположное риѕћ, в за- 
висимости от того, как на это посмотреть.) Добавляет список /15Т в начало масси- 
ва и возвращает новое число элементов в массиве: 


ип$р1 РЕ(@АЯбУ “-е”, $ст@) ип1езз ФАВСМ[07 =- /7-/: 


Обратите внимание, что {157 добавляется целиком, а не по одному элементу, по- 
этому добавляемые элементы сохраняют свой порядок. Для обращения порядка 
следования элементов используйте ге\уегзе. 


Начиная с версии у5.14, ипзи1{ может принимать ссылку на «неосвященный» хеш 
или массив, которая будет разыменована автоматически. Эта особенность ипзИз 
считается экспериментальной. Ее поведение может измениться в будущем. 


ипНе 
ипііе МУАВТАБЕЕ 


Разрывает связь между переменной или іурер1оЬ в УААТАВЕЕ, и пакетом, к которо- 
му она привязана. См. їіе и всю главу 14, особенно раздел «Неочевидная ловушка 
при отвязывании». 


Га 1 ө 
џѕе МОРДЕ УЕВУТОМ 115Т 
изе МОРЕ УЕЯЗТОМ () 
иѕе МОРГЕ УЕРУТОМ 
изе МОВИЕЕ ІТТ 
изе МОВИЕЕ () 
изе МОРИЕЕ 
иѕе УЕРУТОМ 


Объявление изе загружает указанный модуль, если он не был загружен ранее, 
а затем импортирует из него подпрограммы и переменные в текущий пакет. (Го- 
воря формальным языком, в текущий пакет импортируется некоторая семанти- 
ка из указанного модуля, обычно за счет создания псевдонимов для некоторых 
подпрограмм и переменных.) Большинство объявлений и5е выглядит так: 


изе МОБИЕЕ (Т$Т; 
Это в точности эквивалентно высказыванию: 


ВЕСІМ { гедиіге МОБИЕЕ, ітрогі МОРЕ ЕТ$Т } 
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ВЕСІМ заставляет геди ие и іпрогї выполняться во время компиляции. гедиіге обес- 
печивает загрузку модуля в память, если она еще не произведена. іпрогї не являет- 
ся встроенной функцией — это обычный вызов метода класса в пакете с именем 
МОРИ, сообщающий этому модулю о необходимости загрузить список особенно- 
стей в текущий пакет. Модуль может реализовать свой метод импорта любым спо- 
собом, хотя большинство модулей получают его путем наследования от класса 
Ехрогїег, определенного в модуле Ехрогїег. Дополнительные сведения см. в главе 11, 
атакже в модуле ЕхрогТег. Если метод іпрог+ не найден, вызов просто пропускается. 


Чтобы предотвратить изменение своего пространства имен, можно явно передать 
пустой список: 


и$е МОВИЕЕ (); 
Это в точности эквивалентно следующему коду: 
ВЕСІМ { гедизге МОБИЕЕ } 


Если первый аргумент изе является номером версии, например у5.12.3, выпол- 
няемая в данный момент версия Реп] должна быть не ниже указанной. Если теку- 
щая версия Ре! меньше УЕАСТОМ, выводится сообщение об ошибке. и выполнение 
Рей немедленно завершается. Это полезно для проверки текущей версии Ре! пе- 
ред загрузкой библиотечных модулей, зависящих от более новых версий, по- 
скольку иногда нам приходится «ломать» ошибочные функции старых версий 
Рег. (Мы стараемся ломать не больше, чем необходимо. На самом деле, мы часто 
стараемся ломать меньше, чем необходимо.) 


Подтверждением слов «стараемся ломать меньше» может служить сохранившая- 
ся поддержка старых номеров версий в формате: 


иѕе 5.005_03: 


Однако для лучшего согласования с промышленными стандартами все версии 
Реп теперь принимают (а мы предпочитаем видеть) формат из трех компонентов: 


џѕе 5.12.0; # Версия 5, подверсия 12, уровень исправлений 0. 

иѕе м5.12.0; # то же самое 

изе 5.12; # то же самое, но не забудьте добавить символ "у"! 

иѕе 5.012; # то же самое, для совместимости со старыми версиями рег1 
ие 5.12; # НЕВЕРНО! 


Если за аргументом МОШЕ следует аргумент УЕРЗТОМ, изе вызовет метод МЕВЅІОМ 
в классе МОРИЕ с указанным значением УЕРОТОМ в качестве аргумента. Обратите 
внимание на отсутствие запятой после УЕРЗТОМ Метод \ЕВЗТОМ по умолчанию. на- 
следуемый от класса ИМТУЕВЗА!, возбуждает исключение (сгоаК), если указанная 
версия превышает значение переменной $Мод]е: :УЕВЗТОМ. 


Кроме того, начиная с версии у5.10, директива изе УЕВЗТОМ также загружает праг- 
му Геатиге и включает все возможности, доступные в запрошенной версии. См. раз- 
дел «Ёеафиге» в главе 29. Аналогично Ре у5.12 и более поздних версий наклады- 
вает дополнительные ограничения в лексической области, как при использова- 
нии џѕе зїгісі (за исключением того, что файл ѕѓгісі.рт в действительности не 
загружается). 

Поскольку изе обеспечивает широко открытый интерфейс, прагмы (директивы 


компилятора) тоже реализуются посредством модулей. Вот примеры реализован- 
ных в настоящее время прагм: 
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изе аифоизе “Сагр” => дм(сагр сгоак), 
оиѕе Ббідпит; 

иѕе сопзіапї РІ => 4 * аїап2(1,1) 

и5е біадпоѕїісѕ, 

иѕе іпїедег; 

изе 116 "/орї/ргојесїіѕ/ѕресіге/116"; 
иѕе 1оса1е; 

иѕе ѕідегар дм(озе ІМТ ОТТ); 

ие ѕогі дм(5Саб1е _диіскѕогі _тегдеѕогї); 
иѕе ѕїгісї дм(5ѕи0ѕ магз ге?ѕ); 

иѕе їћгеа@ѕ; 

иѕе магпіподѕ ди(питесіс иплп11а117е0); 
це магпіпоѕ ам(ҒАТАІ а11); 


Многие из таких модулей прагм импортируют семантику в текущую область лек- 
сической видимости. (Этим они отличаются от обычных модулей, импортирую- 
щих символы только н текущий пакет, почти не имеющий отношения к текущей 
лексической области видимости – помимо того, что текущая лексическая область 
видимости компилируется с учетом этого пакета. Это значит... впрочем, не имеет 
значения, читайте главу 11.) 


Поскольку объявление изе действует на этапе компиляции, оно не может исполь- 
зоваться в условных инструкциях, управляющих потоком выполнения програм- 
мы. В частности, если поместить изе в ветку е15е условной инструкции, это не 
предотвратит ее обработку компилятором. Если модули или прагмы должны за- 
гружаться только при определенных условиях, реализовать это можно посредст- 
вом прагмы 1: 


иѕе 1! $] < 5.008, “ие#8“; 
05е іҒ МАМГ мАВМТМС$, магпіпдѕ => 9м(а11), 


Имеется соответствующее объявление по, которое «деимпортирует» значения, 
первоначально импортированные изе и ставшие ненужными: 


по іпїіедег; 
по 51гісЕ дм(ге?ѕ); 
по магпіпоѕ ам(дергесатеа); 


Особую осторожность следует проявлять при использовании формы по УЕЛ5ТОМ. Она 
может использоваться только для проверки того, что действующий интерпрета- 
тор Рей имеет более раннюю версию, чем аргумент УЕЯЗТО\, а не для отмены побоч- 
ного эффекта изе \ЕВЗТОМ, выражающегося в активизации возможностей языка. 


См. список стандартных директив в главе 29. 


ите ани 


итте [157 


Изменяет время обращения и время модификации для всех перечисленных фай- 
лов. Первые два элемента списка должны задавать время обращения и модифи- 
кации в числовом виде, причем именно в этом порядке. Функция возвращает 
число услешно измененных файлов. Время изменения каждого файла в его ин- 
дексном узле (іпойе) устанавливается равным текущему времени. Вот пример ко- 
манды ѓоисћ, устанавливающей дату модификации файла (в предположении, что 
вы его владелец) примерно на месяц вперед: 
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#1 /иѕг/ріп/рег1 

# поптоисћ - датирует файль более поздним числом: сейчас + 1 месяц 
$Чау = 24 • 60 * 60; # 24 часа ь виде секунд 

$1аїег = їіпе() + 30 * $0ау; # 30 дней - это примерно месяц 

изме $1аїтег, $1а+ег, @АВСУ; 


а вот более сложная команда в стиле ѓоисћ с некоторой проверкой ошибок: 


#! /иѕг/оіп/регі 

# попіоисћ - датирует файлы более поздним числом: сейчас + 1 месяц 
ФЛатег = їіте() + 30 + 24 + 60 + 60; 

бсаппої = дгер {пої име $1атег, $1а+ег, $_} @АВСУ, 

діе "$0: невозможно выполнить Тоисћ @саппо+.” іё @саппот; 


Чтобы прочесть отметки времени существующих файлов, используйте ѕїаї, а за- 
тем пропустите соответствующие поля через 1оса1їіте или дт те перед выводом. 


В сетевой файловой системе МЕЗ будет использоваться время на сервере МЕ$, а не 
время на локальном компьютере. Если есть проблемы синхронизации времени, 
время будет отличаться на сервере МЕБ и локальном компьютере. Команда юисй(1) 
в ОМІХ обычно использует именно такую форму, а не ту, что показана в первом 
примере. 

Если передать в одном из первых двух аргументов значение ипіеѓ, это будет экви- 
валентно передаче значения 0, и результат будет иной, чем если передать ипдег 
в обоих аргументах. Это также вызовет предупреждение о неинициализирован- 
ном аргументе. 


В системах, поддерживающих /и#тез(2), наряду с именами файлов в списке мож- 
но передавать дескрипторы файлов. В системах, не поддерживающих ѓиѓітеѕ(2), 
передача дескриптора файла вызывает исключение. Чтобы функция успешно рас- 
познала дескрипторы файлов, они должны передаваться как їуреғ1оБѕ или ссыл- 
ки на ёурер1обѕ; голые слова будут интерпретироваться как имена файлов. 


иё1те($1пеп, ФЕпеп, +ЗОМЕ_НАМОЕЕ); 


маіиеѕ АЯ 


уа1џеѕ НАЗН 
уа1џеѕ АВНАУ 


Возвращает список всех значений в хеше НА5Н или в массиве АЙЛАУ. Значения воз- 
вращаются в порядке, кажущемся случайным, но это тот же порядок, который 
создают функции Кеуз и еасћ для того же хеша. Как ни странно, для сортировки 
хеша по значениям обычно требуется функция кеуѕ, поэтому за примером обрати- 
тесь к описанию Кеуз. 


С помощью этой функции можно модифицировать значения в хеше, потому что 
возвращаемый список содержит не копии значений, а их псевдонимы. (В ранних 
версиях для этого требовался срез хеша.) 


Ғог (@һаѕћ{кеуѕ ФпазН}) { з/Роо/баг/д } # по-старому 
Рог (ма1џеѕ Жһаѕһ) { 5/Ғоо/раг/д } # теперь это изменяет значения 


Использование уа1иеѕ с хешем, связанным с большим файлом ОВМ, создаст боль- 
шой список, а в результате вы получите прожорливый процесс. Более практично 
в таком случае будет применить функцию еасћ, которая обходит все записи хеша, 
не создавая при этом гигантского списка. 
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мес [51 


мес ЕХРЯ, ОРЕЗЕТ. ВІТЅ 


Обеспечивает компактное хранение списков беззнаковых целых. Эти целые плот- 
но упаковываются, насколько это возможно, в обычную строку Рег1. Строка в ЕХРА 
рассматривается как строка битов, составленная из произвольного числа элемен- 
тов, зависящего от длины строки. 


ОРЕЅЕТ указывает индекс конкретного элемента, который нас интересует. Синтак- 
сис чтения и записи элемента одинаков, поскольку уес записывает или возвраща- 
ет значение элемента в зависимости от того, в каком контексте она использует- 
ся – левостороннего или правостороннего значения. 


ВІТЅ задает ширину каждого элемента в битах и должно быть степенью двойки: 1, 
2, 4, 8, 16 или 32 (на некоторых платформах также 64). (Если применить значение, 
нарушающее это правило, возникает исключение.) Поэтому каждый элемент мо- 
жет содержать целое в диапазоне 0..(28175)-1. Для меньших размеров в каждый 
байт упаковывается столько элементов, сколько возможно. Когда 6175 равно 1, 
в каждом байте хранится 8 элементов. Когда 8175 равно 2 – четыре. Когда ВІТ5 рав- 
но 4 — два элемента (обычно их называют полубайтами или «нибблами» (пуђЫез)). 
И так далее. Целые, занимающие больше одного байта, хранятся в прямом (Ыз- 
еп 1ап) порядке. 


Список целых чисел без знака можно хранить в одной скалярной переменной, 
присваивая их по отдельности вызовом функции \ес. (Если ЕХРА не является лево- 
сторонним значением, возникает исключение.) В следующем примере все элемен- 
ты имеют ширину 4 бита: 


$0іїѕігіпд = 
фоЕРзет = 0; 


Тог му $пит (0, 5, 5, 6, 2, 7. 12, 6) { 
мес($0іїтѕігіпо, Фоғеѕеї++, 4) = $пит; 
} 


При попытке произвести запись за пределами конца строки, Ре! сначала увели- 
чит строку, дополнив ее необходимым количеством нулевых байтов. 


Векторы, хранимые в скалярной переменной, можно последовательно извлекать. 
задавая правильное смещение ОРРЅЕТ. 


Фпит_е1етепез = Іепоїћ($01+ѕїгіпд)*2; # 2 элемента в байте 


Гог му $оҒҒѕеі (0 .. $пим_е1етептз-1) { 
зау мес($0ітѕїгіпод, $оғРѕе+, 4); 
} 


Если выбранный элемент находится за пределами конца строки, функция воз- 
вращает значение 0. 


Строки, создаваемые хес, можно также обрабатывать логическими операторами 
[, &, 7 и ~. Эти операторы выполняют операции над битовыми строками, если оба 
операнда являются строками. См. соответствующие примеры в главе 3, в разделе 
«Поразрядные операторы». 
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Если ВІТЅ == 1, может быть создана битовая строка для записи последовательно- 
стей битов в один скаляр. Порядок таков, что уес($0іїѕігіпо,0,1) гарантированно 
попадает в младший бит первого байта строки. 


@біїѕ = (0,0.1,0, 1,0, 1,0, 1,1.0,0, 0,0, 1,0); 


ФБітоігіпо = "" 
$оѓѓѕеї = 0; 


Ғог пу $611 (@0115) { 
мес($011$1гіпо, ФоҒҒвеї++. 1) = Ф611; 
Н 


зау "$01151гіпд"; # "ТС", т.е. '0х54`, "0х43 


Битовая строка может транслироваться в строку изединиц и нулей (и также в об- 
ратную сторону) путем передачи шаблона "р*" в раск или ипраск. Можно также ис- 
пользовать раск с шаблоном "Б*" для создания битовой строки из строки, состоя- 
щей из единиц и нулей. Порядок совместим с тем, который предполагает уес. 


$0іїѕїгіпд = раск "б*", 101п(3(), @бітѕ); 
ѕау "$0іїѕїгіпд”; # “ТС”, то же, что раньше 


При помощи ипраск можно организовать извлечение списка нулей и единиц из би- 
товой строки. 


@611$ = 5р111(//, ипраск(”Ь»”, $01757г1п9)); 
зау "@0115"; #0010101011000010 


Если известна точная длина строки в битах, ее можно указать вместо "+". 


Дополнительные примеры использования битовых строк, создаваемых посредст- 
вом уес, можно найти в описании $е1ест. Примеры работы с двоичными данными 
более высокого уровня можно найти в описаниях раск и ипраск. 


май ЕСЕТ 


ма1ї 


Ждет завершения любого порожденного процесса и возвращает его РП) или -1, 
если порожденных процессов не осталось (такое возможно в некоторых системах, 
где порожденные процессы удаляются автоматически). Код завершения возвра- 
щается в $?, как сказано в описании Ѕуѕїеп. Чтобы избежать превращения порож- 
денных процессов в зомби, следует вызывать эту функцию или маіїрій. 


Если порожденный процесс стартовал, а функпия ма1т его не обнаружила, воз- 
можно, вы вызывали ѕуѕїет, закрытие канала или обратные апострофы между 
Ғогк и маії. Эти конструкции тоже выполняют аі (2) и могли закрыть порожден- 
ный процесс. Во избежание этого применяйте маіїріа. 


К Н ГГ Ў 
уаїїріа я. $ | 0 
маітрід РТО, ЕЁАб$ 


Ждет завершения конкретного порожденного процесса и возвращает его РП по- 
сле завершения; -1, если порожденных процессов не осталось, или 0, если флаги 
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Н Аб задают неблокирующий вызов, а процесс еще не завершен. Код завершения 
процесса возвращается в $?, как сказано в описании ѕуѕїеп. Чтобы получить до- 
пустимые значения флагов, необходимо импортировать группу тегов импорта 
:5уѕ маії һ из модуля РОЗ1Х. Вот пример неблокирующего ожидания всех неза- 
вершенных процессов-зомби. 


иѕе РОЗТХ ":5уѕ мазї п”; 
до { 

$Кіб = маіїріа(-1. 8АМОНАМС); 
} ип $К19 == -1, 


В системах, где не реализован ни один из системных вызовов гргаііріа(2) и ша 4(2), 
в аргументе 21Аб5 можно передать только 0. Иными словами, функция позволяет 
дождаться завершения порожденного процесса с конкретным РП, но не позволя- 
ет сделать это в неблокирующем режиме. 


В некоторых системах возвращаемое значение -1 может означать, что порож- 
денные процессы удаляются автоматически. так как пользователь установил 
$$Т6{СНЬО} = "ТЕМ ВЕ”. 


умапїѓагг ау 
маптаггау 


Возвращает истинное значение, если контекст выполняемой в данное время под- 
программы ожидает списочного значения, и ложное в противном случае. Функ- 
ция возвращает определенное ложное значение (`"), если вызывающий контекст 
ожидает скаляра, и неопределенное ложное значение (ипе), если вызывающий 
контекст ничего не ожидает; т.е. если функция находится в пустом контексте. 


Вот примеры типичного использования: 
геїигп ип1еѕѕ деҒіпед маптаггау; # больше не надо трудиться 


пу @а = сотр1ех_са1си1атіоп(); 
гегигп маптаггау ? ёа \еа; 


См. также са11ег. Эта функция в действительности должна была называться 
мапї115ї, но мы придумали это название, когда списочный контекст еще называл- 
ся контекстом массива. 


маги 


магп [15Т 
магп 


ЕЗ 


Генерирует сообщение об ошибке, выводя / 157 в ЭТОЕВВ подобно функции 01е, но не 
пытается завершить работу или возбудить исключение. Например: 


магп “Отладка включена” і? $0ерид; 


Если список / 157 пуст, а $@ уже содержит значение (обычно от предыдущего вызо- 
ва еға1), вслед за $0 в ЅТрЕВА выводится строка `\{...саџоћї”. (Напоминает способ 
распространения ошибки функцией (іе, за исключением того, что магп не распро- 
страняет — не возбуждает повторно - исключение.) Если передана пустая строка 
сообщения, выводится текст "Магпіпо: Ѕотеїћіпо'ѕ мгопо” (Внимание: произошла 
какая-то ошибка). 
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Как и в (іе, если передаваемые строки не заканчиваются символом перевода 
строки, автоматически добавляются сведения о файле и номере строки. Функция 
магп не связана с ключом командной строки Регі -ш, но может применяться совме- 
стно с ней, например, когда требуется эмулировать встроенную функцию: 


магп “`Надвигается беда\п” 1? $; 


Сообщение не выводится, если установлен обработчик $516{__МАВМ__}. Обработчик 
может поступить с сообщением так, как посчитает нужным. Например, простое 
предупреждение можно повысить до звания исключения: 


1оса1 $$16{_ МАВМ__} = $46 { 

ту $т$9 = эВ РЕ; 

О1е $т59 і? $159 =- /1$п'& пипегіс/: 
}; 


Поэтому в общем случае обработчик должен вывести предупреждение, столкнув- 
шись с ситуацией, к которой оказался не готов, путем повторного вызова магп. Это 
совершенно безопасно и не породит бесконечный цикл, потому что обработчики 
__МАВМ__ не вызываются из обработчиков __ИАН№__. Такой режим несколько отли- 
чается от действия обработчиков $516{__ОТЕ__} (которые нє подавляют текст ошиб- 
ки, но могут повторно вызвать 01е, чтобы изменить его). 


Обработчик __МАЯ№__ предоставляет мощный способ подавить все предупрежде- 
ния, даже так называемые обязательные. Иногда обработчик требуется «завер- 
нуть» в блок ВЕСІМ } для выполнения на этапе компиляции: 


# подавить *все« предупреждения этапа компиляции 


ВЕСІМ { $$16{_ МАВМ__} = зи6 { магп $ [0] 11 $00мААМ } } 
пу $Роо = 10; 
пу $#оо = 20; # нет предупреждения о повторном объявлении ту $Ғоо, 


# но вы сами этого хотели! 


# до сих пор никаких предупреждений этапа компиляции или выполнения 
ФО0МАНМ = 1 # «не» встроенная переменная 


# с этого места предупреждения этапа выполнения включены 
маги “\$Роо 1$ а11\е апа $Роо!”: # выводится 


Читайте в описании прагмы магпіпдѕ о том, как управлять предупреждениями 
с лексической областью видимости. Другие способы вывода предупреждений 
реализованы функциями сагр и с1иск модуля Сагр. 


в | пае = Х т 
уге 1$! 5 @ А" 

мгіте ЕТЬЕНАМОЕЕ 

мгіїе 


Выводит форматированную запись (возможно, из нескольких строк) в заданный 
дескриптор файла, используя формат, связанный с этим дескриптором, — см. раз- 
дел «Переменные формата» главы 26. По умолчанию формат, связанный с дескрип- 
тором файла, носит такое же имя. Однако формат для дескриптора файла можно 
изменить, модифицировав переменную $- после выполнения 5е1есї для этого де- 
скриптора: 
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$010 Ғһ = зе1ест(НАМОЕЕ); 
$- = "МЕММАМЕ”; 
ѕе1есї($о1й #Н); 


или сказав: 


иѕе І0: : Напа1е; 
НАМОГЕ->Ғогтаё_пате( “МЕИМАМЕ” ) 


Поскольку форматы помещаются в пространство имен пакета, может потребо- 
ваться полностью квалифицировать имя формата, если объявление ѓогпаї нахо- 
дится в другом пакете: 


$- = "ОтһћегРаск: : МЕИМАМЕ"; 


Обработка верхнего колонтитула страницы производится автоматически: если 
на текущей странице недостаточно места для форматированной записи, страница 
перемещается выводом символа разрыва страницы, для заголовка новой страни- 
цы используется специальный формат верхнего колонтитула страницы. а затем 
выводится запись. Число строк, подлежащих выводу на текущей странице, хра- 
нится в переменной $-, которую можно установить в 0, чтобы форсировать вывод 
новой страницы при следующем вызове игЦе. (Может потребоваться сначала вы- 
полнить 5е1ес{ для дескриптора файла.) По умолчанию именем формата верхнего 
колонтитула является имя дескриптора файла с добавлением ” ТОР”, но формат 
для дескриптора файла можно изменить установкой переменной $^ после выпол- 
нения зе1ес{ для этого дескриптора файла, либо так: 


изе ІО: .Напа1е; 
НАМЕ ->Ғогтаї_ тор пате “МЕММАМЕ ТОР”); 


Если дескриптор ЕП ЕНАМОЕЕ не задан, вывод производится в текущий дескриптор 
выходного файла, каковым изначально является 5ТООЦТ, но может быть изменен 
оператором ѕе1есї с одним аргументом. Если ЕЦЕНАМЕЕ является выражением, 
оно будет вычислено на этапе выполнения, и его результат послужит фактиче- 
ским аргументом Ё ЕНАМОЕЕ. 


Если указанный формат или формат верхнего колонтитула не существует, возни: 
кает исключение. 


Функция иг це не является антиподом функции геай. К несчастью. Для простого 
вывода строк пользуйтесь функцией ргіпї. Если вы открыли это описание в поис- 
ках способа обойти стандартную систему ввода/вывода, обратитесь к функции 
зузиг Пе. 


у// 


у/// 


Оператор транслитерации (исторически называемый также трансляцией), из- 
вестный еще как 1г///. См. главу 5. 
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Стандартная библиотека Рей 


Стандартный дистрибутив Регі включает значительно больше. чем просто испол- 
няемый файл рей, который запускает ваши сценарии. В дистрибутив также вхо- 
дят сотни модулей с кодом, который можно использовать повторнс, которые мы 
называем Стандартной Библиотекой Реп. Стандартные модули доступны всю- 
ду, поэтому программу, обращающуюся к ним, можно запускать везде, где уста- 
новлен Ре!1, без дополнительных шагов при установке. 


Однако следует заметить, что не везде, где имеется регі, присутствует стандарт- 
ная библиотека Рег1. Рег поддерживает множество разных платформ, и вы впол- 
не можете столкнуться с такими операционными системами, производители ко- 
торых изменяют состав библиотеки Рег!. Некоторые производители расширяют 
ее, добавляя дополнительные модули и инструменты. Некоторые могут допол- 
нять отдельные модули, улучшая совместимость со своими платформами (и. хо- 
чется верить, публикуют свои правки в общем репозитории). Однако есть и та- 
кие, кто удаляет те или иные модули. Если вы обнаружите, чтс в стандартной 
библиотеке отсутствует какая-то ее часть, сообщите об этом поставщику или ус- 
гановите Рег! самостоятельно. 


В предыдущих изданиях этой книги мы перечисляли все модули в стандартной 
библиотеке, сопровождая их небольшими описаниями. В этом издании мы убра- 
ли эти описания и вместо этого показываем, как их найти самостоятельно. Одна- 
ко в главе 29 мы сохранили описания всех прагм. 


Библиотечное дело 


Приведем краткий обзор используемой терминологии. Мы, как и все остальное со- 
общество, достаточно свободно применяем эти термины, потому что понятия час- 
то перекрываются или описывают смежные области, но иногда точность важна. 


патезрасе 


Пространство имен (патезрасе) представляет собой место, предназначенное 
для того, чтобы не путать имена, хранимые в нем, с именами в других простран- 
ствах имен. В результате масштабы проблемы уменьшаются - нам остается не 
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путать собственно пространства имен. Есть два способа различать пространст- 
ва имен: давать им уникальные имена или уникальные местоположения. Рег 
позволяет сделать и то и другое: именованные пространства имен называются 
пакетами, а неименованные пространства имен называются областями лек 
сической видимости. Поскольку области лексической видимости не могут быть 
больше, чем файл, и поскольку стандартные модули имеют размер файла (как 
минимум), отсюда следует, что все интерфейсы модулей должны использовать 
именованные пространства имен (пакеты), если с ними будет работать кто-то 
извне файла. 


расЕаве 


Пакет (расЁазе) – это стандартный механизм Рей для объявления именован- 
ного пространства имен. Он обеспечивает простой способ группировать свя- 
занные функций и переменные. Точно так же, как два каталога могут содер- 
жать (различные) файлы с именем Атейа, две различные части программы 
Ре могут содержать каждая свою переменную $Апе]іа или функцию &Апте11іа. 
Даже если этим переменным или функциям даны, казалось бы, одинаковые 
имена, эти имена находятся в различных пространствах имен, определяемых 
объявлениями раскаде. Имена пакетов служат для идентификации модулей 
и классов, как описано в главах 11 и 12. 


ПЫгагу 


Термин библиотека (1іБгагу), к несчастью, довольно перегружен в культуре 
Реті. В настоящее время этим термином мы обычно обозначаем все множество 
модулей Рен, установленных на данной машине. 


Традиционно библиотекой в Ре назывался еще и файл, содержащий набор 
подпрограмм, служащих некоей общей цели. Такой файл часто имеет раситире- 
ние .рі,! сокращение от «рей Нгагу». Мы по-прежнему используем это расши- 
рение для некоторых фрагментов кода Ре, загружаемых с помощью 40 РЕ 
или гедиіге. Не будучи полноценным модулем, библиотечный файл обычно объ- 
являет себя как отдельный пакет, чтобы связанные переменные и подпрограм- 
мы могли храниться вместе и случайно не помешали другим переменным ва- 
шей программы. Обязательного расширения не существует; помимо .рі иногда 
встречаются другие, как разъясняется далее в этой главе. В большинстве ситуа- 
ций на смену этим простым неструктурированным файлам пришли модули. 


тоаше 


Модуль Рей – это библиотечный файл, удовлетворяющий неким особым согла- 
шениям, которые позволяют одному или нескольким файлам, реализующим 
этот модуль, подключаться к программе посредством единственного объявле- 
ния (зе на этапе компиляции. Имена файлов модулей всегда должны завер- 
шаться расширением „рт, поскольку это предполагается объявлением изе. Объ- 
явление зе также транслирует разделитель пакетов в тот символ, который 
выполняет в данной системе функции разделителя каталогов, чтобы структура 
каталогов библиотеки Ре! пользователя соответствовала структуре его паке- 
та. Глава 11 описывает, как создавать собственные модули Рец. 


1 Да, некоторые используют это расширение для программ. Мы не видим в этом ничего 
плохого, если это согласуется с вашим образом мышления или если операционная сис- 
тема принуждает к этому. 
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сіазѕз 


Класс — это просто модуль, в котором реализованы методы объектов, связан- 
ных с именем пакета модуля. Если вас интересуют объектно-ориентирован- 
ные модули, откройте главу 12. 


ргавта 


Прагма (ргавта) – это специальный модуль, который приводит в действие 
скрытые механизмы Регі. См. главу 29, где описаны прагмы стандартной биб- 
лиотеки. 


ехіепзіоп 


Расширение (ехіепѕіоп) – это модуль Регі, который помимо загрузки файла .рт 
загружает также общую библиотеку, реализующую семантику модуля на С 
или С++. 


рговтат 


Программа (рговтат) Ре] представляет собой код, предназначенный для вы- 
полнения в качестве независимой сущности; ее называют также сценарием 
(8сгір?), когда хотят сказать, что не следует ожидать от нее слишком многого, 
приложением (арріісаїіоп) – если она большая и сложная, выполняемым моду 
лем (ехесиїаЫе), когда вызывающему ее безразлично, на каком языке она на- 
писана, или решением в масштабе предприятия (епіегргіѕе ѕоіиїіоп) — если 
она обошлась в целое состояние. Программы Рег! могут существовать в виде 
исходного кода, байт-кода или машинного кода. Если это можно запустить из 
командной строки, мы называем это программой. 


Фяптфиноп 


Дистрибутив (аіѕігіБиііоп) ~ это архив, содержащий сценарии, библиотеки 
или модули с комплектом испытательных тестов, документацией и сценария: 
ми, выполняющими установку. Когда говорят: «получить модуль из СРАМ», 
в действительности подразумевается: «получить дистрибутив». См. главу 19. 


Обзор библиотеки Реп! 


Можно сэкономить огромное количество времени, предприняв попытку ознако- 
миться со стандартной библиотекой Регі, потому чтс совершенно незачем изобре- 
тать колесо заново. Предупреждаем, однако, что эта коллекция невероятно об- 
ширна. Некоторые библиотеки могут быть крайне полезны, другие могут ока- 
заться совершенно неподходящими для ваших нужд. Например, тому, кто пишет 
на стопроцентно чистом Рей, модули, поддерживающие динамическую загрузку 
расширений С и С++, не сильно помогут. 


Рен ожидает найти библиотечные модули где-то на маршруте поиска подключае- 
мых библиотек, @Т\№С. Этот массив задает упорядоченный список каталогов, в ко- 
торых Рей осуществляет поиск, когда загружается какой-нибудь библиотечный 
код с использованием ключевых слов 00, геди1ге или изе. Перечень этих каталогов 
легко получить, выполнив Ре! | с ключом -/ (от уегђоѕе) или такой простой код: 


Х рег1 -1е “рглпт Рог @ТМС”" 
/изг/10са1/116/рег15/з11е_рег1/5. 14. 2/даги1п-21еуе1 
/и$г/10оса1/116/рег15/з1{е_рег1/5. 14.2 
/изг/1оса1/116/рег15/5. 14. 2/дагилп-21еуе1 
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/и$г/10са1/116/рег15/5. 14.2 


Это лишь пример возможного вывода. В каждой установке Рег! прописаны свои 
пути. Важно отметить, однако, что хотя содержание может отличаться в зависи- 
мости от поставщика и политики установки, которой придерживается сервер, 
можно полагаться на то, что все стандартные библиотеки будут установлены вме- 
сте с Регі. Это один из вариантов, когда Регі был установлен вручную. При другом 
способе установки Рей в той же системе можно получить совершенно другой ответ: 


Х /изг/ьап/рег1 -1е "ргіпё Рог ӨІМС” 

Ліргагу/Рег1/5. 12/йагміп-їћгеай-ти1+і-21еуе1 
Ильогагу/Рег1/5. 12 

/Меїмогк/іргагу/Рег1/5. 12/дагміп-тпгеад-ти1ті-21еуе1 
/Меёмогк/ііргагу/Рег1/5. 12 

/ііргагу/Рег1/0рдаїеѕ/5. 12.3 

/Ѕуѕтет/ііргагу/Рег1/5. 12/дагміп-іһгеад-ти1+і-21еуе] 
/Ѕуѕтет/ііргагу/Рег1/5. 12 
/Ѕуѕтеп/ііргагу/Рег1 /Ехїгаѕ/5. 12/йагміп-1іһгеай-ти111-21еме1 
/Ѕуѕтет/ііргагу/Рег1/Ехїгаѕ$/5. 12 


Этот вывод, полученный в Мас ОБ Х 10.7, существенно отличается в смысле место- 
положения модулей. Здесь стандартная библиотека хранится в каталоге /бузет, 
а обновления помещаются ближе к началу списка @1\С. При обновлении Мас ОЗ Х 
обновления не затрут стандартную библиотеку, а попадут в другой каталог, опре- 
деляемый производителем системы. Устанавливаемые вами модули окажутся 
в каталоге /Гібгагу, поэтому обновление операционной системы не затронет ваших 
изменений. Однако при установке можно указать другой каталог (см. главу 19). 


Если заглянуть в эти каталоги, можно обнаружить те же самые модули, но дру- 
гие их версии, а также дополнительные модули. Некоторые поставщики вносят 
собственные правки в стандартную библиотеку. При этом они могут изменять 
или не изменять номера версий. Если вам кажется, что поведение вашего Регі от- 
личается от поведения на других платформах, проверьте, действительно ли на 
других платформах Рег] действует иначе. 


Узнать местоположение модуля можно посредством команды рейаос -1: 


Х рег190с -1 МООШЕ 
/оѕг/1оса1/11р/рег15/51іїе_рег1/5. 14. 2/МО0ШЕ 


Внутри программы переменная %1\С хранит имена уже загруженных модулей 
и пути к ним. Ключами являются пространства имен, преобразованные в пути 
к файлам, такие как Ошсоае/ОСР.рт, а значениями – пути к файлам модулей. 
Подробности см. в главе 25. 


Здесь уместно будет упомянуть одну из проблем, связанных с загрузкой модулей. 
Рей использует первое соответствие, найденное в @1\С. Он не пытается найти по- 
следнюю версию или наиболее подходящую версию. и на практике нет достаточ- 
но удобного способа заставить регі продолжить поиск, кроме как самостоятельно 
реализовать процесс поиска и добавить его в начало @Т№С! или создать новый путь 
к библиотеке, куда помещать ссылки на «лучшие» версии модулей в других ката- 


1 Пример такой реализации можно найти в модуле 1пс: :1атезт. 
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логах. Это не очень удобное решение, требующее осторожности и внимания. На- 
пример, если кто-то установит РЕВ 51168, следует ли выбирать версии, найденные 
по указанному пути, или продолжить поиск в других каталогах? 


Перекличка модулей 


Предыдущее издание включало полный перечень модулей, составляющих стан- 
дартную библиотеку, но эта книга и так уже достаточно раздута, чтобы включать 
в нее еще несколько десятков страниц с простым перечислением модулей, тем бо- 
лее, что с помощью регітойіір вы легко сможете сделать то же самое. Если резуль 
тат работы этой команды вам не нравится, вы можете составить список самостоя- 
тельно, отыскивая файлы с расширением „ри и извлекая непустую строку после 
=һеад1 МАМЕ: 


у5е \5. 10, 
иузе Ее: : Ріпа; 


Му Япатез, 
ту $иаптед = ѕир { 
геёигп ип1ез$ /\. рт\2/; 
ореп(ту ФЁһ, "<", $ЕРе: : Ріпа: : пате) 
|І іе "сап`# ореп $Рі1е: : Ріпа: : папе: $!“ 
ООТЕА: мһі1е( <$#һ> ) { 
пехї ип1езз /\А =Пеад“ \$+ МАМЕ/х; 
мһі1е( <$Ғһ> ) { 
пех і? /ЛА \5* \2/х; 
/ (?<пате>\$+) \$* -+ \ѕ* (?<0еѕс>. *) /х; 
фпатеѕ{ $+{пате} } = $+{@еѕс}; 
1аѕї ОУТЕВ; 


}; 
Ғіпа($мапёеа, емс), 
Гог ту $пате (ѕогї Кеуз %патеѕ) { 


ргіпі? "%-255 - %5\п", $пате, Фпатеѕ{ пате}; 
} 


В Рей версии у5.14 этот сценарий найдет около 500 пространств имен: 


Апурвм_РіЈе — ргоуіае Ггатемогк Ғог ти1тір1е 0ВМ$ 
Арр: :Срап - еаз11у іпіегасі міїһ СРАМ гот 
- їһе сомтапд 1іпе 
Арр: :Ргоуе - ІтрІетепїѕ {пе С<ргоуе> соттапа. 
множество других 
магпіпоѕ - Рег1 ргадта їо сопіго1 орііопа! магпіпдѕ 


магпіпд$ : : гед15Тег - магпіпоѕ ітрогі Ғипсі1оп 
мгітетаіп мгіте їһе С соде Гог рег1таіп. с 


Этот же список можно создать иначе. Модуль Мойџ1е::Согеі іѕї, входящий в стан- 
дартную библиотеку Регі, знает, что входит в состав Регі. Он включает утилиту 
согейзт. Чтобы найти версии, известные ему, запустите утилиту с ключом -0: 
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Х соге113+ -у 

5 

5.000 

5.001 

5.002 

у5. 14.0 

№5. 14.1 
Если указать номер версии с ключом -и, будет выведен список всех модулей, по- 
ставляемых с этой версией Регі: 


Х соге1151 -у 5. 14. 1 
Тһе Ғо110и1п9 тоди1еѕ меге іп рег1 5. 14 1 СОВЕ 


Апурвм_Еі1е 1.00 

Арр: :Срап 1. 5701 

Арр. :Ргоуе 3.23 

.. „множество других 
уегѕіоп 0.88 

мпѕіѕћ 1.02 

магпіпдѕ 1. 12 

магп1п9$: :гедіѕїег 1. 02 


Әта утилита может также выводить хронологию развития модулей, если приме- 
нить ее с ключом -а: 


% соге11іѕї -а Агсһіме: : Ехїгасї 

Агсһіме: :Ехїгасї маѕ Ғ1ігѕї ге1еаѕед міїһ рег1 У5.9. 5 
у5.9.5 0.202 01 

%5. 10.0 0.24 

%5. 10.1 0. 34 


№5. 14,0 0. 48 
№5. 14.1 0. 48 


Если потребуется узнать первую версию Регі, содержавшую модуль, запустите 
утилиту без ключей: 


% соге113{ Мойи1е: : Согеі 156 
Моди1е: :Согеііѕї маѕ Рігѕї ге1еаѕес матг рег1 у5.8.9 


Ключ -4 сообщает первую версию Рег, куда был включен модуль. Например, мо- 
дуль Моди1е::Согеі1$ї был включен в состав стандартной библиотеки в Рег! у5.9.2: 


Х соге115ѕї -9 Мойџ1ө: : Согеііѕі 
Моде: : Согеііѕї маѕ ѓ1гѕї ге1еаѕеа міїһ регі у5.9. 2 


Ключ -4 означает «аїе» (дата), так что не запутайтесь. Версия Реті у5.9.2 вышла 
раньше версии у5.8.9, поэтому результаты выглядят немного странно. 


Будущее стандартной библиотеки 


Существуют две точки зрения на будущее стандартной библиотеки Рех1. Первая 
ратует за то, чтобы поместить в стандартную библиотеку как можно больше мо- 
дулей, чтобы иметь возможность создавать приложения с применением любых 
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модулей и распространять их, не требуя от пользователей устанавливать допол- 
нительные модули. Другая нацелена на создание минимального дистрибутива 
Рей, содержащего лишь самые необходимые модули, с тем, чтобы устанавливать 
дополнительные модули из СРАМ. 


Каждая точка зрения дает определенные выгоды. Большая библиотека несет 
массу преимуществ для пользователей. Им не нужно обременять своих систем- 
ных администраторов установкой дополнительных модулей, так как модули уже 
входят в состав Регі. Маленькая библиотека упрощает труд участников группы 
Рен 5 Рогіегѕ, так как им меньше придется сталкиваться с проблемами переноси- 
мости модулей, и они смогут уделять больше внимания другим задачам. 


Некоторые модули живут двойной жизнью, в том смысле, что они развиваются 
двумя путями. Одна версия находится непосредственно в репозитории Ре! а дру- 
гая – в СРАМ. Это позволяет исправлять проблемы ь модулях быстрее, чем выхо- 
дят новые версии Рег1. Когда приходит время выходг новой версии Рей, сопрово- 
ждающие лица просто переносят изменения из версии СРАМ в исходные тексты 
Рей. Иногда версия в репозитории Рег! исправляется раньше. В этом случае раз- 
работчики в СРАМ переносят изменения в свою версию. 


Долгие годы этот процесс был достаточно сложным, поскольку структура версий 
СРАМ существенно отличалась от структуры версий стандартной библиотеки, что 
усложняло автоматизацию процесса объединения. Помимо исправлений, сопрово- 
ждающим лицам требовалось объединять наборы тестов с остальной частью тестов 
Рег, переносить дополнительные файлы в нужное место и т.д. Нельзя сказать, 
что эта задача вызывала у людей большой энтузиазм. Теперь же принято поме- 
щать дистрибутивы из СРАМ в отдельный каталог в репозитории рей и тем самым 
упрощать внесение изменений в модуль. Такой подход может быть принят всеми 
уже к моменту, когда вы будете читать эту книгу. Поддержка модулей, живущих 
двойной жизнью, существенно улучшилась в последние несколько лет. Это упро- 
щает включение дополнительных модулей в нестандартные дистрибутивы Ре". 


Блуждая по дереву каталогов 


Если просмотреть каталоги и подкаталоги в иерархиях @1№С, можно обнаружить 
несколько различных типов установленных файлов. Имена большинства файлов 
оканчиваются суффиксом ‚рт, но встречаются еще суффиксы .рі, .рћ, „аЁ и .50. 
Наибольший интерес для вас должна представлять первая группа, поскольку рас- 
ширение рт указывает, что файл является подлинным модулем Реп. Более под: 
робно о них чуть ниже. 


Несколько файлов, имена которых оканчиваются суффиксом .рі, представляют 
собой старые библиотеки Ре!, о которых мы говорили выше. Они включены для 
совместимости со старыми версиями Рей из 80-х и начала 90-х годов. Благодаря 
им код Регі, работавший, скажем, в 1990 году, должен по-прежнему нормально 
работать, не привлекая к себе внимания, даже если у вас установлена современ- 
ная версия Регі. Создавая новый код, который использует стандартную библиоте- 
ку Рей, всегда следует по возможности предпочесть версию „рт любой версии .рі. 
Дело в том, что модули не так засоряют пространство имен, как это делают старые 
файлы рі. Поскольку Рей продолжает развиваться, члены группы Рег] 5 Рогіегв 
удалили некоторые из этих файлов, возложив решение соответствующих задач на 
модули или вынуждая вас посетить СРАМ, чтобы получить нужные библиотеки. 


Обзор библиотеки Рей 933 


Одно замечание об использовании расширения .рі: оно означает библиотеку Регі, 
а не программу Рег]. Хотя .рі иногда применяется для обозначения программ на 
Реп на веб-серверах, чтобы отличать исполняемые модули и статические файлы 
в пределах одного каталога, мы предлагаем вместо этого расширения употреб- 
лять для обозначения исполняемых программ Рег! суффикс .ріх. (Аналогичный 
совет относится к операционным системам, которые выбирают интерпретатор, 
исходя из расширения имени файла.) Или не использовать расширение совсем, 
так как регі не требует его. Он будет счастлив выполнить файл ћейо.гЬ, при усло- 
вии, что файл содержит программный код на языке Рег|.1 


Файлы с расширениями .а/ – это небольшие фрагменты более крупных модулей, 
они автоматически загружаются при обращении к их родительскому .рт-файлу. 
Если модуль построен с применением стандартного инструмента ћ2х8 (см. гла- 
ву 19), поставляемого с Реп (и если не был указан флаг Регі -А), то процедура паке 
іпѕїа11 воспользуется модулем АџїоІ оадег, чтобы создать эти файлы .а/ без вашего 
участия. 


Файлы .рћ были созданы стандартной программой А2рћ, несколько устаревшим, 
но иногда все еще необходимым инструментом, который старается транслировать 
директивы препроцессора С в Регі. Полученные файлы „.рй содержат константы, 
иногда необходимые функциям низкого уровня, таким как 10сї1, їспїІ или 
ѕуѕса11. (В настоящее время большинство этих значений может быть получено из 
стандартных модулей, таких как РОЅІХ, Еггпо, Еспї1 или Ѕоскеї, намного более удоб- 
ным и переносимым способом.) О том, как установить эти необязательные, но ино- 
гда важные компоненты, читайте в регіілѕіаі. 


И последнее расширение имени файла, с которым вы можете столкнуться в ката- 
логах стандартной библиотеки, это .50 (или другое применяемое в системе для обо- 
значения общих библиотек). Эти файлы .зо являются зависимыми от платформы 
фрагментами модулей расширений. Первоначально написанные на С или С++, эги 
модули были скомпилированы в динамически перемещаемый объектный код. Ко- 
нечному пользователю, однако, не требуется знать об их существовании, посколь- 
ку они скрыты за интерфейсом модуля. Когда код пользователя говорит гедџіге 
Моди1е или изе Моди1е, Ре] загружает Модше.рт и выполняет его, что позволяет 
модулю загрузить другие необходимые части, такие как МодшЕ.з0 или автомати- 
чески загружаемые компоненты .01. На самом деле модуль может загрузить все что 
угодно, включив 582 других модуля. Он может загрузить весь СРАМ, если ему того 
захочется, а может быть, еще и архивы /гезйтеаф. пе? за последние пару лет. 


Модуль в Рей – это не просто статический фрагмент кода. Это активный агент, 
который определяет, как реализовать интерфейс в ваших интересах. Он может 
выполнять все стандартные соглашения, а может не выполнять. Он может делать 
любые вещи, с тем чтобы исказить смысл оставшейся части вашей программы, 
вплоть до того, что оттранслирует ее в ЗРТТВОГ. Такого рода крючкотворство счи- 
тается совершенно допустимым, если оно хорошо документировано. При исполь- 
зовании такого модуля Рей вы соглашаетесь на его контракт, а не на стандартный 
контракт Рей 


Поэтому старайтесь читать мелкий шрифт. 


1 Одна из задач интерпретатора Рагго& состоит в том, чтобы загрузить и выполнить файл 
реЦо.гь, даже если он содержит программный код на языке КоБу. 
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Модули прагм 


Прагма (ргавта) – это особый тип модуля, влияющий на этап компиляции про- 
граммы. Некоторые модули прагм (или просто прагмы) могут влиять и на этап 
выполнения программы. Считайте их советами компилятору. Поскольку прагмы 
должны быть видимы на этапе компиляции, то и работают они только при вызове 
посредством џѕе или по, потому что к тому времени, когда выполняется гедиіге 
или 00, компиляция давно закончена. 


Имена прагм принято записывать толькс строчными буквами, поскольку имена 
модулей в нижнем регистре зарезервированы для самого дистрибутива Рег1. При 
написании собственных модулей используйте в имени модуля хотя бы одну за- 
главную букву, чтобы избежать конфликта с именами прагм. 


В отличие от обычных модулей, действие прагм в большинстве случаев ограниче- 
но оставшейся частью самого внутреннего охватывающего блока, из которого они 
вызваны. Иными словами, они имеют лексическую область видимости, подобно 
переменным пу. Обычно область лексической видимости внешнего блока охваты- 
вает любой вложенный в него блок, но внутренний блок может отменить прагму 
с лексической областью видимости из внешнего блока с помощью команды по: 


изе зти1ст; 

узе іптедег; 

{ 
по ѕЕг1сЕ "геғѕ"; я разрешить символические ссылки 
по іпїіедег; # возобновить арифметику с плавающей точкой 
я 

} 


Для среды компиляции Ре! прагмы имеют намного большее значение, чем все 
другие модули, поставляемые с Рег1. Трудно хорошо использовать компилятор, 
не зная, как передавать ему советы, поэтому в этой главе мы предпримем допол- 
нительные усилия, чтобы описать прагмы. 

Следует также знать, что мы часто применяем прагмы для прототипирования 


особенностей языка, которые затем превращаются в «реальный» синтаксис Рец. 
Поэтому в некоторых программах вы найдете устаревшие прагмы вроде изе аїїгѕ, 


аїїпібиїеѕ 935 


функциональность которых сейчас поддерживается непосредственно синтакси- 
сом объявления подпрограммы. Аналогично иѕе уагз находится в процессе заме- 
ны объявлениями оџг. Мы не очень спешим ломать старые способы работы, но по- 
лагаем, что новые способы красивее. 


Наконец, в конце этой главы мы покажем, как создавать собственные прагмы, 
действующие подобно штатным прагмам Рег]. 


анирще$ 


ѕир аГипс : петпод: 
ту $с1оѕиге = зир : метров { 


зе аїёгібитеѕ; 
@аїїг116ї = аіїігіриѓеѕ: :9е*(\8аРипс): 


Прагма аіїгібиїеѕ имеет два назначения. Первое — поддержка внутреннего меха- 
низма объявления списков атрибутов (айтьЬише 11518), которые являются необя- 
зательными свойствами, связываемыми с объявлениями подпрограмм и (в буду- 
щем) с объявлениями переменных. (Поскольку это внутренний механизм, обыч- 
но эта прагма не используется напрямую.) Второе назначение — извлечение этих 
списков атрибутов на этапе выполнения посредством функции аїїгібиїеѕ: :деї. 
В этом качестве аїїгібиѓеѕ представляет собой обычный модуль, а не прагму. 


В настоящее время обрабатывается лишь несколько встроенных атрибутов. Ис- 
пользование атрибутов, специфических для пакетов, служит эксперименталь- 
ным механизмом расширения, описанным в разделе «Раскабе-зрес1Яс АбгЬще 
НапаНп&» страницы руководства аѓігіриіеѕ(3). 


Установка атрибутов происходит на этапе компиляции; попытка установить не- 
известный атрибут является ошибкой компиляции. (Ошибка может перехваты- 
ваться еуа1, но все равно прекращает компиляцию в этом блоке е\а1.) 


В настоящее время реализованы только три встроенных атрибута подпрограмм: 
1оскей, метпод и 1уаше. Более подробно они описаны в главе 7. В данное время ат- 
рибуты переменных, подобные реализованным для подпрограмм, не поддержи- 
ваются, но мы подумываем о некоторых вариантах, таких как сопзТапт. 


Прагма аїїг1ритеѕ предоставляет две подпрограммы общего пользования. Вы мо- 
жете запросить их импорт. 


деї 
Возвращает (возможно, пустой) список атрибутов при передаче одного входно- 
го параметра, являющегося ссылкой на подпрограмму или переменную. Эта 
функция возбуждает исключение через Сагр::сгоак, если получает неверные 
аргументы. 

геғ+уре 
Действует сходным со встроенной функцией геї образом, но всегда возвращает 
основной встроенный тип данных для объекта ссылки, независимо от того, 
что он может быть «освящен» в какой-то пакет. 

Реализация обработки атрибутов продолжает изменяться, поэтому з= более пол- 

ной информацией лучше обращаться к электронной документации, сопровож- 

дающей конкретную версию Регі. 


936 Глава 29. Модули прагм 


аиѓоаіе 
иѕе аитодіе; 


Эта прагма превращает неудачи, случившиеся в ходе выполнения функций Рей, 
в фатальные ошибки, но только в своей лексической области видимости. Она за- 
мещает стандартные функции Регі, которые в случае ошибки возвращают лож- 
ное значение, их версиями, возбуждающими исключения. Текст сообщения, воз- 
вращаемого вместе с исключением, сохраняется в $0, что позволяет узнать причи- 
ну ошибки: 


ема1 { 
иѕе ауфод1е; 
ореп ту $#һ, “<:епсод1пд(ИТЕ-8)”, $ҒіЛепате; 
пу 611пе$ = <=#һ>; 


с1оѕе $#ћ; 
} 
Гог ($8) { 
мһеп (ипдег) {} 
мпеп (“ореп”) { зау "Обой ореп”; } 
мһеп (“:10”) { ѕау "Другая ошибка ввода/вывода”; } 
мһеп (":а11") { ѕау “Другая ошибка аџіодіе" } 
деғац1т { зау “Ошибка, не приводящая к вызову аџѓодіе” 


} 


Прагма может также замещать группы родственных функций, например только 
функций, связанных с вводом/выводом: 


џѕе аифод1е 9м(:10); 
Если действие этой прагмы нежелательно в какой-то внутренней области види- 
мости, ее можно отключить: 


по аџїодіе; 


аиќоиѕе 


иѕе аифоизе “Сагр” => дм(сагр сгоак); 
сагр “1$ сагр маѕ ргедес1агед апа аифоизед“; 


Эта прагма реализует механизм загрузки модулей по требованию на этапе выпол- 
нения, т.е. в момент, когда вызывается некоторая функция из этого модуля. Это 
делается путем создания функции-заглушки, которая при вызове заменяет се- 
бя реальным вызовом. По духу она напоминает стандартные модули Аито[оадег 
и 5е1оадег. Если сказать кратко, это «хак» для оптимизации производительно- 
сти, помогающий программе на Рег] запускаться (в общем случае) быстрее за счет 
отсутствия компиляции модулей, которые в данном прогоне могут быть ни разу 
не вызваны. 


Действие аитоизе зависит от того, загружен ли модуль. Например, если модуль 
Моде уже загружен, объявление: 


иѕе аифоизе “Моди1е” => ди(Фипс1 Ғипс2($; Ф) Мойџ1е: : Ғипс3); 
эквивалентно простому импорту двух функций: 


иѕе Моди1е дм(Ғипс1 Ғџипс2); 


Базе 937 


При этом предполагается, что Моде определяет Гипс? с прототипом ($;$), а Гипс] 
и Гипс3 не имеют прототипов. (Вообще говоря, также предполагается, что Моди1е 
использует стандартный метод іпрогї из Ехрогїег; в противном случае возникает 
фатальная ошибка.) Во всяком случае Моде: :Гипс3 полностью игнорируется, по- 
скольку функция предположительно уже объявлена. 


Напротив, если на момент интерпретации прагмы аџїоџѕе модуль Моди1е еще не 
загружен, прагма объявляет, что функции Гипс] и Гипс2 находятся в текущем па- 
кете. Она также объявляет функцию Моди]е: :Рипс3 (что можно рассматривать как 
умеренно антиобщественную деятельность, поскольку антиобщественные по- 
следствия отсутствия модуля Моди]е еще сильнее). При вызове эти функции обес- 
печивают загрузку модуля Моби ]е, а затем заменяют себя вызовами только что за- 
груженных фактических функций. 


Поскольку прагма аиѓоџѕе перемещает часть выполнения программы с этапа ком- 
пиляции на этап выполнения, это может иметь неприятные последствия. Напри- 
мер, если загружаемый по требованию модуль имеет инициализирующий код, 
выполнение которого предполагается на раннем этапе, инициализация может 
произойти слишком поздно. Также могут возникать невыявленные ошибки в ко- 
де, если важные проверки будут произведены на этапе выполнения вместо этапа 
компиляции. 


В частности, если прототип, указанный в строке аитоизе, неверен, это не обнару- 
жится до вызова соответствующей функции (что может произойти через месяцы 
или годы, если функция вызывается редко). Для частичного смягчения этой про- 
блемы можно во время разработки писать код так: 


изе Спазе, 
иѕе аифоузе Сһаѕе => ам(һие($) сгу(&$)); 
сгу "111$ сгу маѕ ргедес1агеб апа аифоизед”; 


Первая строка обеспечивает раннее обнаружение ошибок при задании аргумен- 
тов. Когда программа перейдет из стадии разработки в стадию эксплуатации, 
можно закомментировать обычную загрузку модуля Спазе и оставить только вы- 
зов автозагрузки. В результате будут достигнуты надежность при разработке 
и производительность при эксплуатации. 


Базе 


иѕе базе ам(Мотпег Ғаїһег); 


Обеспечивает удобный способ определения производного класса на основе пере- 
численных родительских классов. Эта прагма почти вышла из употребления, так 
как большинство предпочитает пользоваться прагмой рагепї. 


Приведенное объявление примерно эквивалентно следующему коду: 


ВЕСТМ { 

гедиіге Мотпег, 

гедиіге Ратпег; 

риѕһ @ТЗА, ом(Мотһег Ғаїпег); 
} 


Прагма Базе выполняет все необходимые вызовы гедиіге. Если в области видимо- 
сти находится прагма ѕїгісї "уагѕ”, вызов изе Базе позволяет (в конечном итоге) 
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осуществить присваивание @15А без необходимости вначале объявлять оиг 6@15А. 
(Поскольку прагма Базе обрабатывается на этапе компиляции, лучше не пытать- 
ся самостоятельно изменять @Г5А на этапе выполнения.) 


Но помимо этого раѕе имеет еще одно свойство. Если какой-либо именованный ба- 
зовый класс использует механизм полей, описываемых в объявлении прагмы 
тіе105 (упоминается далее в этой главе), тогда прагма разе инициализирует спе- 
циальные атрибуты полей пакета из базового класса. (Множественное наследова- 
ние классов полей не поддерживается. Прагма баѕе возбуждает исключение, если 
поля присутствуют более чем в одном именованном базовом классе.) 


Любой еще не загруженный базовый класс будет автоматически загружен вызо- 
вом гедиіге. Однако необходимость вызова гедиіте для пакета базового класса оп- 
ределяется не обычным изучением %1\С, а отсутствием глобальной переменной 
$УЕАЗТОМ в базовом пакете. Этот прием не позволяет Регі повторно пытаться (с не- 
удачным исходом) загружать базовый класс, отсутствующий в собственном за- 
гружаемом файле (например, из-за того что он загружен как часть файла некото- 
рого другого модуля). Если $\ЕНЗТОМ не обнаружена после успешной загрузки фай- 
ла, базе определит $\/ЕНЗТОМ в базовом пакете, присвоив ей значение ”-1, деѓіпед Бу 
разе.рт". В последующих версиях прагмы эта строка может измениться. 


Ыідіпі 
изе бібіпї; 


Снимает некоторые архитектурные ограничения и позволяет работать с очень 
большими целыми числами. а также обрабатывать специальное значение №аћ (Моё 
а МитБег – не число): 


изе бідіпї; 
ѕау 2 ** 512; 


Действие прагмы основано на перегрузке арифметических операторов с помощью 
модуля Маїћ::ВідІпі. Эти операторы могут действовать значительно медленнее 
встроенных. Однако лучше подождать и получить правильный ответ, чем поспе- 
шить и получить неправильный. 


Имеется возможность загружать разные библиотеки реализаций, которые могут 
отличаться производительностью. По умолчанию 119111 использует реализацию 
на языке Регі, но вы можете загрузить более быструю библиотеку, если она у вас 
имеется: 


ие 01911 116 => ‘СМР’; 
Можно ограничить число значимых цифр в результате: 
иѕе бідіпї а => 2; 


Или точность, определив порядок округления результата. Точность меньше 0 иг- 
норируется: 


иѕе бідіпт р => -2; # до сотых долей (игнорируется) 
иѕе 61911 р => 1; # с округлениек до 10 


ыдпит 939 


Ыдпит 

иѕе бідпит; 
Снимает некоторые архитектурные ограничения и позволяет работать с очень 
большими числами (или с числами, имеющими большое количество знаков по- 


сле запятой), а также обрабатывать специальное значение Мам (№ а Митьег – не 
число): 


оиѕе бідпип; 
зау загЕ(2); 


Действие прагмы основано на перегрузке арифметических операторов с помощью 
модулей Маїћ::ВідІпї и Мат: :В19Е10а+. См. 619111. 


Ыдагаї 

иѕе ріугаі; 
Снимает некоторые архитектурные ограничения и позволяет работать с рацио- 
нальными числами (т.е. с дробями), сохраняя их в виде рациональных чисел, 


чтобы устранить потери точности (по крайней мере, до момента, когда потеря точ- 
ности станет уже не критичной): 


ие бідгаї; 
ѕау 1/2 + 1/3; # 5/6 


Действие прагмы основано на перегрузке арифметических операторов с помощью 
модулей Мати: :В1оТп{ и Маїп::ВідВаї. См. 619111. 


ЫЬ 
Из командной строки: 


% рег1 -МЬ116 ргодгат [агоѕ... ] 
Х рег1 -М0110=01я ргодгап [агоз... ] 


Из программы Рег: 


и$е 6110 
иѕе 6116 ОТВ; 


Предназначена преимущественно для тестирования произвольных программ 
Рей с отсутствующими в системе версиями пакетов с помощью ключа командной 
строки Реп -М. При этом предполагается, что структура каталогов была создана 
с помощью стандартного модуля Ехт 111$: :МаКеМакег или Мойџ1е::Виі10. 


Ищет структуру каталогов 66, начиная от каталога ОТВ (или от текущего, если 
аргумент 011 опущен), просматривая до пяти уровней вложенных подкаталогов. 
В случае неудачи предпринимает попытку поиска в родительском каталоге «..». 


Буте$ 


ие буїеѕ: 
по Бутез; 
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Отключает символьную семантику для оставшейся части лексической области 
видимости. Для отмены действия изе Бутез в текущей лексической области види- 
мости может применяться прагма по буїеѕ. 


Регі обычно предполагает символьную семантику в присутствии символьных 
данных (данных из источника, для которого определена определенная кодиров- 
ка символов). 


Чтобы понять различие между символьной и байтовой семантикой, обратитесь 
к главе 6. Небесполезной может оказаться также поездка в Токио. 


Әта прагма используется все реже и, скорее всего, она исчезнет в последующих 
версиях Рец. В Рег! версии у5.14 документация прагмы буїеѕ настоятельно не ре- 
комендует использовать эту прагму. Если у вас есть строка, вы можете обрабаты- 
вать ее как последовательность символов, не беспокоясь о кодировке. 


сһагпатеѕ 
изе сһагпатеѕ АОИ; 


ргіпі "\МСРААМАМЕ} 15 а Гиппу сһагасїег"; 


иѕе сһагпатеѕ (); # функции времени выполнения, 
# а не конструкции \№{} времени компиляции 


Все формы, отличные от изе сһагпатеѕ (), включают интерполяцию именованных 
символов в строках с помощью обозначений \М{СНАРМАМЕ}: 


иѕе сһагпатеѕ " : 011"; 
ргіпі “\М(ОВЕЕК МАГ ГЕТТЕЯ $16МА} называется сигмой.\п" 


иѕе сһагпатеѕ ”:$Погт”; 
ргіпі “\№{9геек:519та} это прописная сигма. \г."; 


иѕе сһагпатеѕ дм(суг1111с огеек); 
ргіпї "\Мѕідта} это греческая сигма, а \№бе} это кириллическое 0.\п“ 


иѕе сһагпатеѕ ": Ғџ11", “:а1іаѕ” => { 
7МВҮ САТ” => "САТ ЕАСЕ МТТН МВҮ ЅМІЕ”, 
ТАМЕ ТА” => “ОНОМЕОАНУ САМЕГ”, 


"5 міїТћ сотта” => 0х0219, 
}; 


# ":1003е” поддерживается только в \5. 16 и выше 
изе спагпатез “:1005е”; 


Аргумент :Ри11 указывает, что СНАЛМАМЕ следует считать полным именем. а поиск 
выполнять в списке стандартных имен символов Юникода. Аргумент :5һогї в со- 
четании с СНАВМАМЕ вида ЅСЛІРТ:СММЕ, указывает, что СМАМЕ — это буква, а поиск сле- 
дует выполнять в алфавите 5СЯТРТ. Если присутствует аргумент :100ѕе (и сценарий 
выполняется под управлением Регі у5.16 или более поздней версии), он действует 
точно как :їи11, за исключением того, что поиск имен выполняется без учета ре- 
гистра символов, наличия пробельных символов и символов подчеркивания, по 
аналогии с именами свойств Юникода в регулярных выражениях. 
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Если НОИ содержит конкретные названия алфавитов!, СНАЯМАМЕ считается буквой, 
и поиск выполняется в указанных алфавитах в указанном порядке. Чтобы найти 
СНАВМАМЕ в заданном алфавите 5СВТРТМАМЕ, производится поиск по шаблонам: 


ЭСАТРТМАМЕ САРТГАЕ ТЕТТЕА СНАЯМАМЕ 
САТРТМАМЕ МАЦІ ТЕТТЕВ СНАВМАМЕ 
СНІРТКАМЕ ГЕТТЕВ СНАЯМАМЕ 


Если СНАРМАМЕ целиком находится в нижнем регистре, то вариант САРТТАЕ игнори- 
руется. В противном случае игнорируется вариант МАШ. 


изе спагпатез “бгеек”; 
рип “\МЅідта} \№{з19та} \М{Р1па1 ѕіона}\п” ; СЖ“ 


иѕе сһагпатеѕ  татзп”; 
ргіпі “\№407} МЮ мітћ зта11 1еїтег 2} \№{92}\п”; #0 иф 


Конструкция \МЛАМЕ} интерпретируется только на этапе компиляции как особая 
форма строковой константы в двойных кавычких. Имя символа МАМЕ должно быть 
литералом; внутри конструкции \№{МАМЕ} нельзя использовать переменную. Ана- 
логичная функциональность на этапе выполнения предоставляется функцией 
сһагпатеѕ::згіпо уіапапе, описываемой ниже. 


Форма записи \№{1+НЕХОТСГ!$}, где НЕХОТСГТ$ — шестнадцатеричное число, также 
вставляет символ Юникода в строку, но в отличие от всех остальных форм запи- 
си, \Ж...} не требует прагмы спагпапез. Она вставлнет символ с кодом (порядко- 
вым значением), равным указанному шестнадцатеричному числу. Например, 
\№0+263А} соответствует символу Юникода, изображающему улыбающееся лицо 
(черное лицо на белом фоне). Эта форма записи не требует прагмы сһагпапеѕ, тогда 
как для форм записи с именами символов вроде \№ИНТТЕ ЗМП-Т№б РАСЕ} использо- 
вание данной прагмы является обязательным условием. 


Любая строка, содержащая \№{СНАВМАМЕ} или \№{И+НЕХОТСТТ$}, автоматически полу- 
чает семантику Юникода, даже если не используются функции для работы с Юни- 
кодом. 


Для управляющих символов С0 и Сі (0+0000..0-001Е, 0+0080.0-+009Т) не су- 
ществует официальных имен в Юникоде, но вы можете использовать имена, оп- 
ределяемые стандартом 180 6429: умЕ ЕЕЕ, ЕЗСАРЕ И Т.Д. или их аббревиатуры: ГЕ, 
ЕЅС и другие. Список часто используемых синонимов можно найти на странице 
срагпатеѕ справочного руководства. 


Если имя символа в конструкции \№{МАМЕ} не обнаруживается, выводится преду- 
преждение и выполняется замещение символом Юникода кЕРТАСЕМЕМТ СНАВАСТЕЕ 
(О-ЕЕЕО). 


Если в области действия прагмы руїеѕ символ \МЛАМЕ} не укладывается в один 
байт (т.е. если его порядковый номер превышает 255), возникает фатальная 
ошибка. 


1 Текущий список алфавитов в Юникоде можно найти в странице рейитргорз справоч- 
ного руководства. 
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Пользовательские имена символов 


Существует возможность определять собственные имена символов, чтобы упро- 
стить их ввод или дать имена кодам, не имеющим их. Синонимы можно добав- 
лять с помощью анонимных хешей: 


иѕе сһагпатеѕ ":а1іаѕ" => { 

е АСТЕ => “ТАТТМ МАШІ ЕТТЕ Е МТТН АСТЕ", 

ХАРРІЕ 1060” => ОхЕВЕЕ, # код для частного использования 
}; 
ту $31г = "\МАРРЕЕ 1060%": 


или с помощью файла, хранящего список пар ключ/значение: 
џѕе сһагпатеѕ ":ајіаѕ" => “рго”; # загляните в ипісоге/рго а11аз.р1 


Файл должен храниться в каталоге ипісоге/ где-то в пути @Т\С, а его имя должно 
оканчиваться строкой _аііазѕ.рі. Например, файл, упомянутый выше, будет иметь 
имя ипісоге/рго апаз.р!. Этот файл должен содержать простой плоский список 
Реп: 


( 
А дгауе => "ГАТІМ САРІТАІ ГЕТТЕЯ А ИТТН СВАУЕ”, 
А сігс => "ГАТІМ САРТТАЕ ГЕТТЕВ А ТТН СТАСИМЕСЕХ”, 
А діаег => “ГАТТМ САРТТАЕ ГЕТТЕВ А МІТН ОТАЕВЕЅ15", 
А 91ег => "ІАТІМ САРТТАЕС ІЕТТЕВ А МІТН ОТАЕВЕЗТ$”, 
А иті => “|АТІМ САРТТАЕ ГЕТТЕА А МТТН ОТАЕВЕЗТ$”, 
А 1119е => “ТАТТМ САРТТАС ГЕТТЕВ А МІТН ТГЕОЕ”, 
А масгоп => "ГАТІМ САРТТАЕ ЕЕТТЕН А МТТН МАСВОМ”. 

); 


Оба метода автоматически вставляют :ѓи11 в качестве первогс аргумента, если 
нет других аргументов. Аргумент :#џ1]1 можно также передать явно: 


оѕе сһагпатеѕ ":#и11", ”:а11а$” => “рго”; 


Имена можно давать даже символам, зарезервированным для частного использо- 
вания. Например, после: 


иѕе спагпатез ": #и11"°, ":а1іаѕ" => { 
“ТЕЮСМАН ТЕТТЕН ТІМСО" => 0хЕ000, 
“ТЕЮСИАН 1ЕТТЕВ РАВМА” => 0хЕ001, 
“ТЕМСМАН +ЕТТЕВ САЁМА” => 0хЕ002, 
"ТЕМСМАН ЕЕТТЕВ ОЦЕЗЗЕ“” => 0хЕООЗ, 
"ТЕМСИАН _ЕТТЕА АМОО“” => 0хЕОО4, 


} 


строковые константы и константы регулярных выражений, находящиеся в той 
же лексической области видимости, могут ссылаться на символы по этим именам: 


АР (/\М{ТЕМОМАВ ГЕТТЕВ ТІМСО}/) {.. } 


Поиск на этапе выполнения 


Данная прагма также предоставляет три функции для выполнения преобразова- 
ний между именами символов и числовыми значениями во время выполнения, 
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а не во время компиляции, как конструкция \МЖСНААЛАМЕ}. Эти функции перечис- 
лены ниже: 


сһагпатеѕ::му1апате 


Принимает официальное имя, официальный синоним или пользовательский 
синоним и возвращает единственный код символа. Например, преобразует 
строку "АТІМ ЅМАі1 ІЕТТЕВ А" в число 0х61. 


сһагпалеѕ::51гіпо уіапапе 


Принимает строку, которая может быть официальным именем, официальным 
синонимом или именованной последовательностью, и возвращает строку. На- 
пример, строка "_АТІМ 5МАШ ІЕТТЕВ А” будет преобразована в "а". В случае име- 
нованных последовательностей возвращаемая строка (иногда) может содер- 
жать более одного символа. 


сһагпатеѕ: :у1асоде 


Принимает целое число и возвращает соответствующий официальный сино- 
ним, и официальное имя, если синоним отсутствует. Например, преобразует 
число 0х61 в строку “ГАТТМ МАЦ ТЕТТЕВ А“. Пользовательское имя возвраща- 
ются, только если отсутствует официальное имя, как, например, для кодов, 
зарезервированных для частного использования. 


Эти функции не экспортируются, поэтому для работы с ними требуется указы- 
вать полные квалифицированные имена. Они также обеспечивают доступ к лю- 
бым пользовательским синонимам на этапе выполнения программы. Следующий 
пример демонстрирует работу каждой из этих функций: 


иѕе м5. 14, 

иѕе магп1п9$; 

иѕе магпіпоѕ РАТАЁ => "ТВ: 
иѕе ореп дм( :5+0 :и118); 


изе сһагпатеѕ “:Ри11", “:а31а$” => { 
есиїе => “|АТІМ МАШ ТЕТТЕН Е МІТН АСТЕ”, 
“АРРЕЕ 1060" => ОхЕВЕЕ, # символ для частного использования 


}; 


ргіпі? "О+%04Х 1$ патеа '%$’.\п”, 0хЕд => сһагпатех: :уіасоде(0ОхЕ9); 


рип "%5 15 соде Џ+ЖО4АХ. \п", есите => сһағпатеѕ: :уіапате( “есите” ); 
ргіпіғ? "5 1$ ѕїгіпо '%5`.\п". есите => спагпапез: : ѕїгіпо_уіапате( "есите" ); 
ргіпЕР "О+%04Х 15 патеб `%$’.\п”, ОХЕВЕЕ => сһагпатеѕ: :міасоде(ОхЕ8ЕҒ): 


ргіпіе "%з 15 соде Џ+%04Х.\п", "АРРІЕ 1060” => сһагпапеѕ: :міапате( "АРРІЕ 1060"); 
ргіпї? "%$ 1$ ѕігіпод `%5'.\г", "АРРІЕ 1060” => сһагпатеѕ: :ѕігіпо_уіапате( “АРРЕЕ 1060”); 


Ниже представлен вывод этого сценария: 


0+00Е9 15 патва `АТІМ МАЦІ ТЕТТЕЯ Е МІТН АСИТЕ`. 
есите 1$ сойе Џ+00Е9 
есите 1$ ѕїігіпо ‘ё’ 


О+ЕВҒЕ 1$ патед `АРРІЕ 1060`. 
АРРІЕ 1060 1$ собе О+Е® Е. 
АРРІЕ 1060 15 ѕігіпо '&’ 
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Вы можете даже написать собственный модуль, работающий, как прагма спагпашез, 
но по-иному определяющий имена символов. Однако предназначенный для этого 
интерфейс все еще является экспериментальным, поэтому для получения по- 
следних сведений обратитесь к странице руководства. 


сопѕїапї 


иѕе сопѕтапї ВОЕҒЕВ_512Е => 4096; 
иѕе сопѕћапі ОМЕ_УЕАВ => 365.2425 * 24 + 60 * 60; 


иѕе сопѕ+апё РІ => 4 * аїап2 1, 1: 
иѕе сопзфапе ВрЕВЦССІМ6 => 0; 
чѕе сопѕбапЕ ОВАСІЕ => ‘огас1е@с$. іпдіапа. ейи”; 


изе сопѕёапі ИЗЕАМАМЕ => эса1аг деїриџій($<); 
изе сопзфапе ИЗЕАТМЕО => 9е1рми19($<); 


иѕє сопзтапе { 
ВОҒҒЕВ 5146 => 4096, 
ОМЕ_УЕАВ => 365.2425 * 24 * 60 * 60, 


РТ => 4 » аїап2( 1, 1), 
РЕВУбСТМб => 0, 
ОВАСЬЕ => ‘огас1е@сѕ. іпдіапа. еди’, 


ОЗЕВМАМЕ => эса]аг деїрииіа(%<), 
ОЗЕВТМЕО => 9е%рми19($<), 
}: 
ѕир дед2гаа { РТ + $ [0] / 180 } 
ргіпі "Тһѕ 11пе доеѕ потһіпо" ип1еѕѕ ОЕВОССІМС; 


й ссылки могут быть объявлены константами 


изе сопѕтапі СНАЗН => { Ғоо => 42 }; 
иѕе сопѕтапі САВВАУ => [ 1,2,3,4 ]; 
иѕе сопзфапе ССОВЕ => ѕџир { "ріїе $ [0]\п" } 


ргіпЕ СНАЗН->{Ро0}; 
ргіпі САВВАУ->[$1]; 
ргапЕ СС00Е->(“те”), 
ргіпі СНАЗН->[10]; # ошибка этапа компиляции 


Объявляет именованный символ неизменяемой константой! с заданным скаляр- 
ным или списочным значением. Значения вычисляются в списочном контексте. 
С помощью ѕса1аг можно принудительно установить скалярный контекст, как 
показано выше. Передавая ссылку на хеш, можно объявить множество констант 
единственной инструкцией изе. 


Поскольку имена констант не предваряются символом $, их нельзя непосредст- 
венно интерполировать в строки, заключенные в двойные кавычки, но можно де- 
лать это косвенно: 


ргіпі "Тһе ма1ие оѓ РТ 1$ @{{ РТ ]}.\п"; 


1 Реализованной как подпрограмма без аргументов, возвращающая одно и то же значе- 
ние. 
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Поскольку списочные константы возвращаются как списки, а не как массивы, 
индексирование следует осуществлять посредством дополнительных круглых 
скобок, как и для любых других списочных значений: 


$Һотеаіг 
Фһотебі г 


ЏЅЕВІМЕОГ7 ; # НЕВЕРНО 
(ОЅЕВІМҒО) [7]; # ок 


Хотя имена констант рекомендуется составлять только из заглавных букв (плюс 
символы подчеркивания между словами), чтобы выделить их и предотвратить 
конфликты с другими ключевыми словами и названиями подпрограмм, это всего 
лишь соглашение. Имена констант должны начинаться буквой или символом 
подчеркивания, но буква не обязана быть заглавной. 


Константы не ограничиваются лексической областью видимости, в которой дей- 
ствует прагма. Они представляют собой просто подпрограммы без аргумен гов 
в таблице символов пакета, в котором объявлены. На константу С0№Т из пакета 
Офпег можно сослаться, как на 0їћег::С0№57. Читайте дополнительно о встраива- 
нии таких подпрограмм на этапе компиляции в разделе «Подставляемые функ- 
ции-константы» главы 7. 


Как и для всех директив изе, выполнение изе сопѕтапї происходит на этапе ком- 
пиляции. Поэтому объявление сопзтап{ внутри условного оператора, например 
Те ($700) { изе сопѕїапі }, будет в лучшем случае вводить в заблуждение, По- 
скольку директива выполняется на этапе компиляции, Рег] может заменить вы- 
ражение его фактическим значением. 


Если опустить значение символа, он будет давать значение ипіеѓ в скалярном кон- 
тексте и пустой список () в списочном. Но лучше объявлять такие значения яв- 
ным образом: 


иѕе сопѕїапі САМЕТО$ => (); 
изе сопѕапі САМЕЕ НОМЕ => џпде?; 


Ограничения констант 


Списочные константы в настоящее время не внедряются в код (іпііпе), как ска- 
лярные константы. Невозможно также создать подпрограмму или ключевое сло- 
во с таким же именем, как у константы. И это, вероятно, Правильный Путь. 


Нельзя объявить одновременно больше одной константы: 
иѕе сопзфапт ЕОО => 4, ВАН => 5; # НЕВЕРНО 


В результате будет объявлена константа ҒО0, возвращающая список (4, “ВАН”, 5). 
Вместо этого нужно записать: 


изе сопзфапе РОО => 4 
изе сопѕћапї ВАА => 5; 


или даже: 


изе сопзфапЕ { 
200 => 4, 
ВАВ => 5, 
}: 


Неприятности могут возникнуть в случае применения констант в контексте, 
в котором голые имена автоматически заключаются в кавычки. (Это относится 
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к любому вызову подпрограммы, не только к константам.) Например, нельзя ска- 
зать ФПази{СОМЗТАМТ}, потому что СОМЗТАМТ будет интерпретироваться как строка. 
Используйте ФпазН{СОМСТАМТ( )} или $ПазИ{+СОМ$ТАМТ }, чтобы воспрепятствовать дей- 
ствию механизма расстановки кавычек. Аналогично, поскольку оператор => за- 
ключает в кавычки свой левый операнд, если он является голым именем, пра- 
вильной будет запись СОМЅТАМТ() => “уа1ие“, а не СОМУТАМТ => “уа1ие“. 


Чергесате 
иу$е дергесате, 


Базовые модули, помеченные как кандидаты на удаление из стандартной библио- 
теки, используют эту прагму для вывода предупреждения, что вместо них долж- 
ны использоваться версии из СРАМ. Если модуль не входит Е состав стандартной 
библиотеки, эта прагма ничего не делает. 


Чадпо$с$ 


иѕе біадпоѕіісѕ; # включение для этапа компиляции 
иѕе біадпоѕїісѕ -мегроѕе; 


епаб1е біадпоѕїіс; # включение для этапа выполнения 
діѕар1е діадпоѕтісѕ, # выключение для этапа выполнения 


Расширяет обычную сжатую диагностику и подавляет вывод повторяющихся 
предупреждений. Дополняет краткие версии более подробными пояснениями, 
которые можно найти в ре фах. Как и другие прагмы, действует на этапе компи- 
ляции, а не только на этапе выполнения. 


Если поместить иѕе 1адпоѕї1сѕ в начало программы, автоматически включается 
режим -ш командной строки путем установки $7! в значение 1. Последующая 
компиляция будет осуществляться с расширенной диагностикой. Сообщения бу- 
дут по-прежнему выводиться в ЭТОЕНН. 


Нельзя применять по 41а09п03{1с3 для отключения сообщений на этапе компиля- 
ции из-за взаимодействия между задачами этапа выполнения и этапа компиля- 
ции, а также потому, что это вообще плохая идея. Однако управлять диагности- 
кой на этапе выполнения можно с помощью методов 91а ]е и епа 1 е. (Не забудьте 
сначала выполнить изе, иначе невозможно будет использовать эти методы.) 


Флаг -уегроѕе предписывает выводить вступление к странице руководства 
регійіар перед какой-либо диагностикой. Можно установить переменную $0129- 
поѕіісв::РВЕТТУ (перед тем, как выполнять изе), чтобы генерировались улучшен- 
ные езсире-последовательности для программ постраничного вывода вроде [еѕѕ(1) 
или тоге(1): 


ВЕСІМ { $0іадпоѕтісѕ: :РВЕТТУ = 1 } 
иѕе біадпоѕіісѕ; 


Предупреждения Рег, которые обнаруживает эта прагма, выводятся только один 
раз. Это удобно, если вы находитесь в цикле, повторяющем одно и то же сообще- 
ние (например, неинициализированное значение). Предупреждения, создавае- 
мые вручную, например вызовами магп или сагр, не фильтруются этим механиз- 
мом обнаружения дубликатов. 
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Вот несколько примеров использования прагмы 01іадпоѕї1сѕ. Приводимый файл, 
несомненно, выдаст несколько ошибок как при компиляции, так и во время вы- 
полнения: 


иѕе діадпоѕтісѕ, 

ргіпі МОМНЕНЕ "поїћапо\п" 

ргіпі ЭТОЕВН “\п\ЕТһіѕ теѕѕаде зпои14 бе ипадогпеа. \п"; 
магп “\Тһіѕ 15 а изег магпіпд"; 

ргіпі “\пОТАСМО$ТТС ТЕЅТЕВ: Р1еаѕе епфег а <СВ> һеге: ” 
пу Фа, $0 = эса1аг <5Т0ІМ>; 

ргіпЕ "\п”; 

ргіпї $х/$у, 


А вот вывод: 


Рагепїћеѕеѕ тіѕѕіпд агоипб “ту” 1151 аї о1ад.р1 11пе 6 (#1) 
(И рагепёћеѕіѕ) Үои за14 ѕотеёћ1по Јіке 


пу фғоо, $баг = ё, 
мпел уои пеапї 
ту ($Г00, $оаг) = © : 


Вететрег ТВРат “му”, ‘оиг”, "1оса1“ апа “ѕїаїте" біло 
їідћїег їһап сотта. 


Мате "таіп::у" иѕеа оп1у опсе роѕѕіб1е їуро аї 91а9.р1 1іпе 8 (#2) 
(М опсе) Туродгарћіса1 еггогз оҒтеп ѕћом ир аѕ ип1дие уагіар1е папеѕ. 
Т! уси паа а дооа геазоп Рог һауіпо а ипідие пате, {ћеп јиѕї тепїііоп 
ії адаіп ѕотеһом То ѕирргеѕѕ {Пе теѕѕаде. Тһе оиг десіагаїіоп іѕ 
ргоузаед Рог їһіѕ ригрозе. 


№ТЕ: Тһіѕ магплпд детестз ѕутоо15 їһаї һауе Бееп изед оп1у опсе $50 
фс, @с, Жс, *с, ёс, ѕир с{}, с(), апа с (1һе Е11евапд]е ог Ғогтаї) 
аге сопѕібегед їһе заме; 11 а ргодгат изех $с оп1у опсе Биф а15о иѕеѕ 
апу о? Те о{пегз 14 м111 пої їгіддег 111$ магпіпд. 


Мате "таіп: :0" изеб оп1у опсе: ро$$161е {уро аї діад.р1 1іпе 6 (#2) 
Мате "таіп: : МОМНЕЋЕ” џиѕед оп1у опсе: роѕѕір1е +уро аї діад.р1 11пе 2 (#2) 
Мате "таїп::х” иѕей оп1у опсе: роз$161е їуро аї 91а9.р1 Јіпе 8 (#2) 


ргіпї() оп ипорепед Ғі1еһапдіе МОМНЕВЕ ат 91а9.р1 1іпе 2 (#3) 
(М ипорепед) Ап Т/О орега+іоп маз атфетрфед оп а #і1ећапд1е їћаї маѕ 
пеуег іпіїіаїіғей. Үои пеед то йо ап ореп(), а ѕуѕореп(), ог а зоскет») 
са11, ог са11 а сопѕїгисіог Ёгот еһе Еі1еНапд1е раскаде. 


Тһіѕ теѕѕаде ѕһои1а бе ипадогпед. 
Тһіѕ 15 а озег магпіго аї 91а9.р1 1іпе 4. 


РТАСМОЅТІС ТЕЗТЕВ: Р1еазе епїег а<СВ> һеге: 


зе о? ипіпітіа1і7ед уа]ие $у іп діміѕіоп (/) аї 91а9.р1 1іпе 8, <5Т0ІМ№ 
1іпе 1 (#4) (и ипіпіїіа1іғед) Ап ипдеѓіпед уа1ие маѕ изей аз ії ії 
меге а1геаду Пеғіпей ІҮ маѕ іпіегргеїтед аѕ а "` ога 0, 0иї паубе 
ії маѕ а паэтаке То зирргез$ 101$ магпіпо аѕѕідп а деҒіпеа уа1ие їо 
уоиг уагіар1еѕ. 
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То һе1р уои Ғідџиге оџї мћаї маз ипде1пед, рег] м11] {гу їо їе11 уои 
їпе пате о? їһе уагіар1е (1? апу) ТПаф маѕ ипде1пед. Іп ѕоте саѕеѕ 
ії саппоё до їһіѕ, $0 ії а150 їе115 уои мћаї орега оп уои изед іһе 
ипдеѓілед уа10е іп. М фе, һомеуе:, Ёһаї рег] оріітіғеѕ уоиг ргодгат 
апа їһе орегатіоп діѕр1ауед іп {Пе магпіпо тау пої песеѕѕагі1у арреаг 
Іітега11у іп уоиг ргодгат. Рог ехатр1е, "+ћаї $Рос” 1$ иѕџа11у 
ортітіғед іпіо па ”. $100, апо +һе магпіпо м111 геғег їо їһе 
сопсатепаїіоп (.) орегаїог, емеп їһоцдћ їһеге 15 по . іп уоиг ргодгам. 


Џѕе оѓ ип1піїла1ілеа уа1џе $х 1п а1у1510п (/) ат дад. р1 1іпе 8, 
<5Т0ІМ> 1іпе 1 (#4) 


І11еда1 діуіѕіоп Бу 26го аї діад.р1 1іпе 8, <5Т0ІМ 11пе 1 (#5) 
(Е) Үои тгіес їо діуіде а пипбег Бу 0. Еіёћег ѕотеїћіпо маз мгопд 1п 
уоиг 109іс, ог уси пеед їо рит а сопдіїіопа1 іп {0 циагЯ адаіпѕї 
пеапіпд1еѕѕ іприї. 


Џпсаџдћі ехсертіоп Ғгот изег соде: 
Т]еда1 діуіѕіоп Бу 2его аї діад.р1 1іпе 8, <5Т0ІМ 1іпе 1 
аї діад.р1 1іпе 8 


Диагностические сообщения извлекаются из страницы реа справочного руко- 
водства. Если обнаруживается обработчик $516{__МАНМ__}, он будет действовать, но 
только после того как функция 01а9п0511с3::5р]а1пИ1з (обработчик $516{_ МААМ__} 
в прагме) закончит свою работу с вашими предупреждениями. В настоящее вре- 
мя Рей не поддерживает стеки обработчиков, так что этс лучшее, что мы сейчас 
можем сделать. Если вам уж очень любопытно, что же там такое перехватывает- 
ся, установите переменную $0іадпоѕїіс::рЕВиС: 


ВЕСТМ { $0іаџпозѕтісѕ: :ОЕВУб = 1 } 
иѕе а1адпоѕіісѕ; 


епсой19 


иѕе епсодіпо ЕМСОРІМС; 
иѕе епсодіпо "еис-јр” 


Эта прагма исходно предназначалась для того, чтобы дать возможность писать 
исходные тексты на языке Рег! в любой кодировке ЕМСОРТИС и позволить Регі без- 
ошибочно преобразовывать строки символов в программе, а также выводить со- 
общения потока стандартного вывода и потока ошибок в указанной кодировке. 
Однако она никогда не работала правильно и, вероятно, никогда уже не будет. 
Вместо этого мы рекомендуем вам преобразовывать исходные тексты программ 
в кодировку ОТЕ-8, после чего включать объявление изе џїїё в начале файла. Для 
установки кодировки стандартных потоков ввода/вывода используйте прагму 
ореп или функцию біптойе. 


#еаѓќиге 


иѕе Геафиге *:5. 10"; # это целый “пакет особенностей“ 
иѕе Теаїиге дм(ѕау зТафе зміїсһ ипісойе_ѕігіпоѕ); 


{ 


Нез 949 


по Теафиге дм(зау); 


} 


Рег] готовится к наступлению будущего, вводя новые ключевые слова и возмож- 
ности и предоставляя доступ к ним посредством прагмы ѓеаїџге. Эта прагма 
включает или выключает возможности языка в лексической области видимости. 
Включить или выключить те или иные возможности можно с помощью тега вер- 
сии или имени возможности. 


зау 


Включает ключевое слово зау, действующее подобно ргіпїі, но автоматически 
добавляющее символ перевода строки. 


ѕгаїе 


Включает ключевое слово ЗТате, позволяющее использовать в подпрограммах 
переменные, сохраняющие свои значения между вызовами. 


ѕміїсћ 
Включает «заряженную» инструкцию 91\еп-ипеп. 
џпісоде_5їгіпдѕ 


Эта возможность не является ключевым словом. Она принудительно придает 
всем строкам в лексической области видимости семантику Юникода. Она так- 
же придает эту семантику всем регулярным выражениям, компилируемым 
в области ее видимости, даже если эти регулярные выражения будут исполь- 
зоваться за ее пределами. См. раздел «Тһе Опісоаде Вие» в странице рейитсоде 
справочного руководства. Эта единственная особенность, которая не входит 
в пакет :\5.10, хотя она входит в пакеты :\5.12 и более поздних версий. 


Неа 


Применение этой прагмы не рекомендуется начиная с Регі версии у5.10, и мы не 
станем поощрять ее использование, рассказывая о ней. Она появилась как способ 
объявлять поля класса, тип которых проверяется на этапе компиляции. Меха- 
низм работы ѓієе10ѕ опирался на возможность языка (ныне не существующую), 
известную под названием псевдохеш. Если вам доведется столкнуться с прагмой 
Ғіе105 в унаследованном коде, вы всегда сможете прочитать о ней в документа- 
ции, которая все еще содержит ее описание (во всяком случае, это так для Рей 
версии у5.14). 


НІеѓесѕї 


фсап_регһарѕ_геай = -г “Ғ1Је"; # использовать биты режима 
{ 
иѕе Ғі1етеѕї "ассеѕѕ '; 6 стараться угадать 
$сап_геа11у геад = -г "Ғі1е"; 
} 


фсап_регћарѕ _геас = -г “Ре”; # использовать биты режима 


Эта прагма с лексической областью видимости указывает компилятору на необ- 
ходимость изменить режим работы унарных операторов тестирования файлов -г, 
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—м, -х, -Н, -М и -Х, описанных в главе 8. В режиме по умолчанию эти операторы 
используют разряды режима, возвращаемые семейством вызовов ѕЅїаі. Однако 
это не всегда правильно, например, если файловая система поддерживает АСГ, 
(Ассевз Сопіго] 11843 – списки управления доступом). В таких средах, как ДЕЗ, 
где это имеет значение, прагма Ғі1еїеѕї помогает операторам разрешений возвра- 
щать результаты, лучше согласующиеся с другими инструментами. 


Применение этой прагмы может несколько снижать производительность опера- 
торов проверки файлов, потому что в некоторых системах расширенную функ- 
циональность приходится эмулировать. 


Предупреждение: всякие мысли о применении проверок файлов для защиты дан- 
ных совершенно бессмысленны. Здесь открываются широкие возможности для 
возникновения «ситуации гонки», так как невозможно гарантировать, что права 
доступа не изменятся в промежутке между тестированием и реальным действи- 
ем. Заботясь о безопасности, не следует использовать операторы тестирования 
файлов, чтобы решить, будет ли нечто работать. Нужно просто выполнить факти- 
ческую операцию, а затем проверить, успешно ли она завершилась (это нужно де- 
лать в любом случае). См. раздел «Обработка ошибок синхронизации» главы 20. 


4 
и$е і? СОМОТТТОМ, МОРІЛЕ => ТМРОВТЗ: 
изе 1 $70 =- /Миіп/, "М1п32: :Еі1е“; 


иѕе 1 $^У >= 5.010, рагепї => дм(Мојо1ісіоиѕ·:ЏѕегАдепі), 
иѕе 1Е $ < 5.010, Базе => дм(ШР: : УзегАдепе); 


Прагма 1! позволяет организовать условную загрузку модуля. Она не позволяет 
реализовать загрузку модуля с минимально допустимым номером версии. После 
имени модуля можно указать список импортируемых возможностей. 


шс:1ае$* 


иѕе 1пс::1афезф “Моди1е: :Ви1 19"; 


Некоторые авторы модулей распространяли зависимости, включая их в каталог 
тс в дистрибутиве. Если требовалось использовать определенную версию модуля 
Модџ1е::Вџі1а, например, они устанавливали ее в каталог тс в своем дистрибутиве 
и отдавали предпочтение этой версии перед любой другой. До того, как инстру- 
ментальные средства Рен научились понимать сопѓідиге_гедиігеѕ, эта прагма по- 
зволяла запускать процедуру сборки с модулями внутри дистрибутива. 


Прагма 1пс::1атеѕт сообщает Ре! о необходимости загрузите версию из каталога 
іпс, но только если эта версия больше установленной в @1МС. 


ниедег 


иѕе 1птедег; 
$х = 10/3; 
# $х теперь 3, а не 3. 33333333333333333 


[е55 951 


Эта прагма с лексической областью видимости указывает компилятору, что с это- 
го места и до конца охватывающего блока он должен использовать операции с це- 
лыми числами. Во многих системах это не играет особой роли для большинства 
вычислений, но на тех редких архитектурах, где нет аппаратной поддержки дей- 
ствий над числами с плавающей запятой, производительность может резко изме- 
ниться. 


Обратите внимание, что прагма оказывает воздействие на некоторые числовые 
операции, но не на сами числа. Например, если выполнить такой код: 


иѕ6 1птедег; 


$х = 1.8; 
$у = $х + 1 
$2 = -1.8; 
в результате получится: $х == 1.8, $у == 2и фи == -1. С $2 это произошло потому, 


что унарный минус считается операцией, поэтому перед изменением знака значе- 
ние 1.8 усекается до 1. Аналогично функции, предполагающие получение чисел 
с плавающей запятой, например $0г{ или тригонометрические функции, продол- 
жают принимать и возвращать вещественные числа даже в области действия изе 
іпіедег. Поэтому результат $4г+1(1.44) равен 1.2, но 0 + $4г{(1.44) теперь просто 1. 


Используется арифметика целых чисел, предоставляемая компилятором С ва- 
шей платформы. Это означает, что собственная семантика Рей для арифметиче- 
ских операций может не сохраниться. Часто источником проблем служит оста- 
ток при делении отрицательных чисел. Ре может делать это одним способом, 
а ваша машина — другим: 


Х рег1 -1е "”ргіпї (4 Х -3)" 
-2 


Х рег1 -Міптедег -1е "ргіпї (4 Х -3)” 
1 


Кроме того, целочисленная арифметика вынуждает поразрядные операторы счи- 
тать свои операнды знаковыми целыми числами: 


х рег1 -1е "ргіпї -0” 
18446744073709551615 


Х рег1 -Міптедег -1е “ргіпі -0“ 
-1 


[е5$ 


иѕе 1е55; 


изе 1еѕѕ “СРИ”; 

иѕе 1езз "петогу”; 

изе 1е55 "ііпе”; 

изе 1е55 “015Кк”; 

изе 1е5$ "Ғаї”; # отлично сочетается с “изе 1оса1е”; 


Реализованная в Рен версии у5.10 и более поздних, эта прагма по задумке долж- 
на советовать компилятору, генератору кода или интерпретатору идти на опреде- 
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ленные компромиссы, используя подсказки для новых ссылок на хеши, которые 
теперь возвращает са11ег. 


Этот модуль всегда входил в состав дистрибутива Рен (как шутка), но ничего не 
делал до версии у5.10. Но даже теперь подсказки доступны только в лексической 
области видимости, поэтому 1ез33 так и остается всегс лишь демонстрацией воз- 
можностей новой функции са11ег, хотя из документации складывается впечатле- 
ние, что другой модуль легко сможет выяснить, чего вам хотелось бы меньше (1езѕ). 


Не будет ошибкой попросить Рег! использовать чего-либо меньше (1езз), даже ес- 
ли он пока не умеет этого делать. 


ПЬ 
иѕе 116 “ФЕММ{НОМЕ} /1ібрег1“; # добавить -/1іррег1 
по 116 “."; # удалить сма 


Упрощает работу с @ТМС на этапе компиляции. Обычно применяется для добавле- 
ния новых каталогов в маршрут поиска, чтобы позже команды 00, гедиіге и изе 
могли находить библиотечные файлы, которых нет в пути поиска Ре по умолча- 
нию. Это особенно важно для изе, потому что происходит и на этапе компиляции, 
а обычная установка @Т№ (т.е. на этапе выполнения) может произойти слишком 
поздно. 


Параметры, передаваемые изе 116, добавляются в начало маршрута поиска Рен. 
Сказать иѕе 110 [Т5Т – это почти то же самое, что сказать ВЕСІМ { ипѕћіті(еІМС, (157) }, 
но иѕе 116 [157 включает поддержку специфических для платформы каталогов. 
Дия каждого каталога $0іг из списка аргументов прагма 116 проверяет также, су- 
ществует ли каталог с именем $Ф/$агсйпате/аилю. Если да, каталог $4й"/$агсВ 
пате считается соответствующим специфическим для платформы каталогом 
и добавляется в ТКС (перед $01). 


Во избежание избыточных записей, замедляющих поиск и расходующих па- 
мять, дублирующиеся записи в конце @1\С удаляются при добавлении. 


Обычно требуется только добавлять каталоги в @Т№С. Если понадобится удалить 
каталоги из @Т\С, постарайтесь убрать только те, которые сами добавили, или те, 
в отношении которых вы уверены, что они не понадобятся другим модулям ва- 
шей программы. Другие модули могли добавить в @01\С собственные каталоги, не- 
обходимые им для правильной работы. 


Прагма по 116 удаляет все вхождения указанных каталогов в ®1 МС. Она также 
удаляет соответствующие специфические для платформы каталоги, как описано 
выше. 


Загружаясь, прагма 11р сохраняет текущее значение ©Т№С в массив @110::0АІб ІМС, 
поэтому, чтобы восстановить исходное значение @1\С, достаточно скопировать 
в нее этот массив. 


Хотя @1М№С обычно содержит точку (.), текущий каталог – это не столь удобно, как 
может показаться. Во-первых, запись с точкой идет последней, а не первой, чтобы 
модули, установленные в текущем каталоге, не получали более высокий приори- 
тет, чем их версии, уже установленные в системе. Если требуется иное поведение, 
можно сказать изе 11р “.’. Хуже, что это текущий каталог процесса Рег. а не ка- 
талог, где располагается сценарий, что делает поиск в текущем каталоге совер- 
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шенно неоднозначным. Если мы создаем программу и несколько модулей, кото- 
рые она должна использовать, все будет отлично во время разработки, но при за- 
пуске не из того каталога, где находятся файлы, все сломается. 


Одно из решений заключается в применении стандартного модуля Ріп)Віп: 


иѕе РіпаВіп, # где проживает сценарий? 
изе 110 $ҒіпаВіп: :Віп; # использовать этот каталог и для 116$ 


Модуль ҒіпіВ1п пытается обнаружить полный путь к программе текущего процес- 
са. Не используйте его для защиты, потому что злонамеренные программы, если 
постараются, смогут его обмануть. Но если не ломать модуль специально, он бу- 
дет работать как нужно. Модуль предоставляет переменную $Е1п9В1п: :В1п (кото- 
рую можно импортировать), содержащую предположение модуля о каталоге ус- 
тановки программы. Можете использовать прагму 116, чтобы добавить этот ката- 
лог в свой массив @1\С, создав путь, относящийся к выполняемому файлу. 


Некоторые программы предполагают установку в каталог біл и пытаются обна- 
ружить свои библиотечные модули в каталоге 16, на том же уровне, что и біп. На- 
пример, программы могу“: находиться в /иѕг/осаі/арасће/Ббіп или /ор/рег/бт, 
а библиотеки — в /изгЛосаГ/арасве/ИЬ и /ор/ре/Йь. Следующий код ловко ис- 
пользует это обстоятельство: 


иѕе РіпдВіп 9и($Віп); 
изе 116 "%Віп/.. /116”; 


Если в нескольких разных программах заданы одни и те же параметры изе 110, 
возможно, будет уместно установить переменную среды РЕВ! 511В. См. описание 
переменной среды РЕВІ 5118 в главе 17. 


# синтаксис для зп, Базй, Къй или 281 
$ РЕВІ 51ІВ=$НОМЕ/рег1116; ехрогЕ РЕНЕБЕТВ 


# синтаксис для сѕһ или Ёсѕһ 
% ѕетепу РЕАІ5.ІВ -/рег111Ь 


Если необходимо работать с дополнительными каталогами только в этой програм- 
ме, не меняя ее исходного кода, воспользуйтесь ключом командной строки -Г: 


% рег1 -Т -/рег1116 ргодгат-раїћ агд$ 


Подробнее о применении -Ё в командной строке читайте в главе 11. 


юсае 


@х = ѕогт @у; # сортировка в порядке АЗСТТ 
{ 
изе 1оса1е; 
@х = зог{ @у; # использовать при сортировке национальные установки 


} 
@х = ѕогї @у; # снова сортировка в порядке АЗСТТ 


Эта прагма с лексической областью видимости говорит компилятору, что нужно 
включить (или выключить, если это прагма по 10са1е) использование националь- 
ных настроек РОЅІХ во встроенных операциях. При включенных настройках 
функции преобразования регистра и механизм поиска по шаблону учитывают 
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языковую среду, разрешая символы с диакритическими знаками и тому подоб- 
ное. В области действия этой прагмы, если ваша библиотека С знакома с нацио- 
нальными настройками РОЅІХ, Рег] будет учитывать значение 1С СТҮРЕ в регу- 
лярных выражениях и [С_СОШАТЕ при сравнении строк, например в ѕ0гї. 


Поскольку эти установки являются скорее формой национализма, а не интерна- 
ционализма, их применение может давать неожиданные эффекты при использо- 
вании Юникода. Более переносимый и надежный способ преобразования регист- 
ра и сравнения строк – использовать встроенную поддержку Юникода, стандарт- 
ную для всех вариантов Ре! а не полагаться на, возможно, слишком замыслова- 
тые национальные настройки. За дополнительными подробностями обращайтесь 
к разделам «Сравнение и сортировка строк Юникода» и «Сортировка с учетом ре- 
гиональных настроек» в главе 6. 


ГО 


изе го, # включает пехї: :теёћод и родственные ему глобально 


иѕе тго "0#5”; # включает 0Е$ МВО для данного класса (по умолчанию’ 
иѕе тго "сЗ"; # включает СЗ МВО для данного класса 


По умолчанию поиск методов в Регі сначала выполняется в глубину, по классам 
(пакетам) в @1№С. Прагма пго изменяет этот порядок поиска. С аргументом 91$ 
(аер®-Ёгз% зеагсВ) поиск по умолчанию ведется сначала в глубину, а с аргумен- 
том сЗ используется алгоритм СЗ, позволяющий разрешать некоторые неодно- 
значности при множественном наследовании. В отсутствие списка импортирова- 
ния сохраняется порядок поиска методов по умолчанию посредством включения 
некоторых возможностей, взаимодействующих с алгоритмом СЗ (см. главу 12). 


ореп 
иѕе ореп ІМ => “:сг1Ғ", ОПТ => “:гам”: 
иѕе ореп О0Т => ":џ+#8“; 
иѕе ореп 10 => “:епсодіпо(150-8859-7)"; 


иѕе ореп 10 => ";10оса1е"; 


иѕе ореп ”:епсод1п9( 18)”; 
изе ореп “:1оса1е`; 
иѕе ореп ":епсодіпд(1з0-8859-7)" 


и5е ореп ”:$14”; 


Объявляет один или несколько фильтров ввода/вывода (прежнее название -- дис 
циплины), но только если Ре! был собран с поддержкой Рег ТО. Любой оператор 
ореп и геадр1ре (т.е. 9х// или обратные апострофы), попадающий в область дейст- 
вия этой прагмы и не указавший собственные фильтры, использует эти объявле- 
ния по умолчанию. В любом случае, эта прагма не оказывает влияния на ореп 
с явно заданным набором фильтров, равно как и на ѕуѕореп. 


В настоящее время на выбор имеется несколько фильтров: 
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:руїеѕ 
Считает данные символами с кодами в диапазоне от 0 до 255. Противоположен 


фильтру :иї1#8. Отличается от фильтра : гам, поскольку все же может обрабаты- 
вать комбинации СВІЕ в Уіпдомѕ. 


СПЕ 


Соответствует текстовому режиму, когда окончания строк преобразуются 
в родные для системы последовательности и обратно. Не выполняет никаких 
действий в системах, где біппойе является пустой операцией. Доступен без под- 
держки Рег ПО. 


:епсобіпо(ЕМСОРІМС) 
Определяет кодировку, поддерживаемую модулем Епсоде, прямо или косвенно. 
поса1е 
Обеспечивает кодирование и декодирование данных в соответствии с нацио- 
нальными настройками. 
:гам 
Этот псевдофильтр отключает все нижележащие фильтры, которые не интер- 
претируют данные как двоичные. Не выполняет никаких действий в систе- 
мах, где біпподе является пустой операцией. Доступен без поддержки РегПО. 
:510 
Фильтр :510 в действительности не является фильтром. Он применяет другие 
фильтры, указанные в директиве, к стандартным дескрипторам файлов. С ар- 
гументом ОТ устанавливает фильтры для стандартного вывода. С аргументом 
ІМ – для стандартного ввода. 
зға 
Обеспечивает кодирование и декодирование данных в кодировке ОТЕ-8, ин- 
терпретируя их как строки символов. Противоположен фильтру :буїеѕ. 


При использовании встроенного фильтра иї#8 в потоках ввода очень важно подго- 
товить дескриптор файла к обработке ошибок кодирования. Вот как это сделать 
наилучшим образом: 


иѕе магпіпоѕ РАТАЁ => “и{{8"; # на случай появления ошибок кодирования 


При таком подходе ошибки кодирования будут вызывать исключения. Восста- 
новление нормальной работы при наличии таких ошибок возможно. но сопряже- 
но с большими сложностями. 


орѕ 
рег1 -М-орз=зузтет . # запретить код операции "ѕуѕїет ` 


Прагма орѕ запрещает некоторые коды операций с необратимым глобальным эф- 
фектом. Перед запуском программы интерпретатор Рег] всегда компилирует ис- 
ходный код во внутреннее представление. По умолчанию на генерируемые коды 
операций не накладывается никаких ограничений. Запрещая коды операций, 
можно управлять компиляцией сценариев; попытка скомпилировать запрещен- 
ную операцию будет вызывать ошибку компиляции. Однако не следует думать, 
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что это позволяет повысить безопасность. Дополнительную информацию о кодах 
операций можно найти в описании модуля 0рсоде. Обратите также внимание на 
модуль Ѕаѓе (глава 20), который может оказаться более удачным выбором. 


омегіоаа 


В модуле №пбег: 


раскаде Мимоег; 
изе омег1оад “+” => \&туад0, 
“-” => \Фпуѕир, 
"ж=7 => пиру Бу"; 


В пользовательской программе: 


изе Митоег; 
$а = М№трег->пем( 57 ); 
$6 = $ + 5; 


Встроенные операторы хорошо работают со строками и числами, но имеют мало 
смысла в применении к ссылкам на объекты (поскольку, в отличие от Си С++, 
Рей не поддерживает арифметику указателей). Прагма о\уег1оад позволяет пере- 
определить алгоритмы работы этих встроенных операций для объектов, создан 
ных программистом. В предыдущем примере вызов прагмы переопределяет три 
операции над объектами №ирег: сложение будет вызывать функцию №ипоег::пуада, 
вычитание — функцию №прег::туѕио, а оператор присваивания с умножением — 
метод пи1{1р1у_Бу в классе Митег (или одном из его базовых классов). Мы говорим, 
что эти операторы теперь перегружены, потому что на них возложен дополни- 
тельный смысл (а не потому, что у них теперь слишком много значений, хотя бы- 
вает и так). 


Значительно подробнее о перегрузке сказано в главе 18. 


омепоааіпд 


по омег1оадіпд; 


Это одна из немногих прагм, которые чаще используются для отключения, а не 
для включения чего-либо. В данном случае прагма отключает все перегруженные 
операции, возвращая им нормальное поведение до конца лексической области 
видимости. 


Чтобы отключить перегруженные операции, следует использовать те же ключи, 
что и в прагме оуег1оаа: 


по оуег1оадтпо 9и(""); # отключить перегрузку преобразования в строку 
Чтобы вновь включить перегрузку, выполните обратное действие: 


иѕе оуег1осайіпо; 8 включить все обратно 


џѕе оуег10аа1пд @0р$; # включить только часть 


рагепї 957 


рагепї 


иѕе рагепі дм(Моїћег Ғаїћег); 


Прагма рагепі служит заменой прагмы баѕе. Она загружает модули и устанавли- 
вает отношения наследования без обращения к волшебству хеша %ҒІЕ! 05. Поддер- 
живает возможность создания иерархии наследования без загрузки файлов. 


Следующий пример эквивалентен загрузке обоих родительских модулей и добав- 
лению их в @Т№С без явного объявления @1\С: 


ВЕСІМ { 

гедиіге Моїһег; 

гедиіге Раїћег; 

ризп @15А ом(Моїһег Ғаїһег); 
} 


Предполагается, что каждый родительский модуль находится в отдельном фай- 
ле. Если родительские классы определены в том же файле или уже были загру- 
жены из файла как часть другого класса, можно воспользоваться параметром - 
погедиіге, который просло устанавливает отношения наследования: 


иѕе рагепф дм(-погедит ге Мотпег Ратпег); 
Эта строка эквивалентна добавлению указанных классов в @15А: 


ВЕСІМ { 
риѕһ @ТЗА, ом(Мо+һег Ратвег): 
} 


ге 


Управляет применением регулярных выражений. Может вызываться пятью спо- 
собами: їаіпї, еуа1 и /#1а95, имеющими лексическую область видимости, а также 
дерид и дебидсо1ог, которые ее не имеют. 


иѕе ге “Талпт”; 
# Содержимое Фтафсп меченое, если $ігїу тоже меченая. 
($таїсһ) = ($91г%у =- /^(.*)$/з); 


# Разрешить интерполяцию кода: 
изе ге “еуа1” 
$раї = '(?{ $маг = 1 })`; # выполнение встроенного кода 
/а1оһа${ра+}отеда/; # даст ошибку при -Т 
# и мечености $раї 


иѕе ге “/а”; # по умолчанию все шаблоны получат флаг /а 
иѕе ге “/мзх”; в по умолчанию все шаблоны получат флаги /тѕх 
изе ге “дебид”; # как “рег1 -Ог” 

/7( *)$/з; # выводить отладочную информацию 


# на этапах компиляции и выполнения 
иѕе ге “дебидсоТог”: # то же. что “дебид”, но с расцветкой вывода 


изе ге дм(Бебив 11$Т); # точное управление выводом отладочной информации 
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В области действия изе ге “їаіпі”, когда объект регулярногс выражения является 
меченой строкой, нумерованные переменные регулярного выражения и значе- 
ния, возвращаемые оператором п// в списочном контексте, являются мечеными. 
Это полезно, когда применение регулярных выражений к меченым данным на- 
правлено не на извлечение безопасных подстрок, а на осуществление других пре- 
образований. Читайте описание меченых данных в главе 20. 


Если действует џѕе ге “еуа1", в регулярном выражении разрешены утверждения, 
выполняющие код Ре! и имеющие вид (?{ }), даже если регулярное выраже- 
ние содержит интерполируемые переменные. Выполнение фрагментов кода в ре- 
зультате интерполяции переменных в регулярное выражение обычно запрещено 
по причинам безопасности: нехорошо, если программы. читающие шаблоны из 
файлов конфигурации, аргументы командной строки или поля форм ССІ, вдруг 
начнут выполнять произвольный код, если только не были специально разработа- 
ны для такой цели. Эта прагма разрешает интерполяцию только немеченых строк; 
меченые данные все равно будут возбуждать исключения (если выполнение про- 
изводится при включенной проверке меченых данных). См. также главы 5 и 20. 


Для этой прагмы интерполяция предварительно скомпилированных регуляр- 
ных выражений (создаваемых оператором цг//) не считается интерполяцией пере- 
менных. Тем не менее при создании шаблона 0г// требуется, чтобы действовала 
иѕе ге "ема1", если в интерполированных строках содержатся утверждения с ко- 
дом. Например: 


$собе = '(?{ $п++ })`; # кодовое утверждение 
фѕЁг = ‘\Линь $соде; # сконструировать интерполируемую строку 


$11пе =- /$51г/; # здесь нужна изе ге "еуа1” 
$раї = дг/ф51г/, # здесь тоже нужна изе ге “еуа1” 
$1іпе =- /$раї/, # а здесь не нужна иѕе ге "еуа1" 


Режим флагов, изе ге `/Ғ1а05", включает модификаторы шаблонов по умолчанию 
для операций поиска, подстановки и для операторов заключения регулярных вы- 
ражений в кавычки в лексической области действия прагмы. Например, если не- 
обходимо, чтобы все шаблоны в файле использовали семантику АБСП для сим- 
вольных классов (\а, \м и \5): 


мпіЛе (<>) { 
узе ге “/а“; 
і? (Ла/) { # только 0 .. 9 
ргіпї "Найдена цифра АЅСІІ: $_”; 


} 


Включение одного из модификаторов шаблонов, воздействующих на символьные 
классы, как традиционные, так и РОЅІХ (/а01и), переопределяет любые настрой- 
ки, выполненные с помощью прагмы 10са1е или возможности ипісоае_ѕігіпоѕ. 


Чтобы включить поддержку многострочного режима, когда ^ и $ соответствуют 
символам перевода строки, а не только началу и концу текста (/п), точка (.) соот- 
ветствует символу перевода строки (/5) и применяется расширенный режим опре- 
деления шаблонов (/х), используйте: 


иѕе ге "/тѕх”; 


гар 959 


В области действия џѕе !е “деБид” Ре выводит отладочные сообщения во время 
компиляции и выполнения регулярных выражений. Вывод получается такой же, 
как при выполнении «отладочного Рей» (скомпилированного сключом -ООЕВУССТАС 
компилятора С) и выполнении программы Рей с ключом -Рг командной строки 
Реп. В зависимости от сложности шаблона вывод может получиться огромным. 
Вызов изе ге "дебидсо1ог” раскрашивает вывод, что может быть удобно, если терми 

нал понимает последовательности, управляющие цветом. Назначьте переменной 
среды РЕВЕ_ВЕ_ТС в качестве значения список свойств {егтсар(5) для выделения, 
разделив значения запятыми. Дополнительные сведения вы найдете в главе 18. 


Чтобы получить более полное управление отладочным выводом, используйте 
ОеБид (с большой буквы 0) и список того, что требует отладки. Параметр А11 экви- 
валентен использованию изе ге ”дебид": 


{ 


изе ге дм(ребид А13); # то же, что и “иѕє ге `дебид`” 


} 


Для прицельного управления отладочным выводом пробуйте другие варианты. 
Например, параметр СОМРТЕЕ обеспечит отладку только инструкций, связанных 
с компиляцией шаблона: 


{ 


изе ге ом(берид СОМРТЕЕ); # то же, что и изе ге “дебис” 


} 


Другие возможные параметры перечислены в документации к модулю ге. 


ѕідќгар 


уе ѕідїгар, 
изе зідігар дм(ѕтаск-тгасе 014-1пїегҒасе-ѕідпа15) # то же самое 


иѕе ѕідігар дам(ВиЅ ЅЕСУ РІРЕ АВВТ) 

иѕе ѕідігар ом(біе ІМТ (ИТТ); 

иѕе ѕібдігар дм(діе погта1-ѕідпа15); 

изе ѕідігар ом(діе ипігарреа погта1-ѕідпа1); 

иѕе ѕідігар дм(діе иопфгарреб погта1-$19па1$ 
зтаск-Тгасе алу еггог-ѕідпа15); 


иѕе ѕібдігар “Һап@1ег” => \ёту һапд1ег, “погта1-$19па1$”; 
иѕе ѕідїігар ам(һапд1ег ту һапдіег погта1-319па1$ ѕтаск-їгасе еггог-$19па1$), 


Устанавливает некоторые простые обработчики сигналов, чтобы программисту 
не нужно было о них беспокоиться. Это полезно, если неперехваченный сигнал 
может вызвать нарушение работы программы, как бывает, если программа со 
держит блоки ЕМ {}, вызывает деструкторы объектов или другую обработку на 
выходе, которую нужно произвести независимо от способа завершения работы 
программы. 

Когда выполнение программы прерывается из-за неперехваченного сигнала, она 


немедленно завершает работу без выполнения заключительных операций. Если 
программист предусмотрит обработку и преобразование сигналов в фатальные 
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исключения, при их появлении будет происходить следующее: будет выполнен 
выход из всех областей видимости с освобождением занятых в них ресурсов и бу- 
дет произведена обработка всех блоков Е№О. 


Прагма ѕідїгар предоставляет два простых обработчика сигналов. Один обеспе- 
чивает трассировку стека Рег], а другой возбуждает обычное исключение посред- 
ством Піе. Можно также передать прагме собственный обработчик. Можно задать 
предопределенные группы перехватываемых сигналоь или передать собствен- 
ный список сигналов явным образом. Кроме того, прагма способна установить об- 
работчики только для тех сигналов, которые не обрабатываются иным способом. 


Аргументы, передаваемые визе ѕідїгар, обрабатываются по порядку. Когда встре- 
чается определенное пользователем имя сигнала или имя одного из предопреде- 
ленных списков сигналов, немедленно устанавливается обработчик. Когда встре- 
чается ключ прагмы, его действие распространяется только на обработчики, ус- 
танавливаемые далее при обработке списка аргументов. 


Обработчики сигналов 


Следующие ключи определяют, какой обработчик будет использоваться для сиг- 
налов, расположенных далее в списке: 


ѕтаск-їгасе 


Этот обработчик, предоставляемый прагмой, выводит трассировку стека Рег 
в ЭТОЕВВ, а затем пытается выполнить дамп памяти. Это обработчик сигналов 
по умолчанию. 

діе 
Этот обработчик, предоставляемый прагмой, вызывает озе через Сагр: :сгоак, 
передавая сообщение, указывающее на перехваченный сигнал. 

һапд1ег УОУВНАМОЕЕВ 
УОИВНАМОЕЕР будет играть роль обработчика сигналов для встретившихся далее 
в списке сигналов. УО/ВНАМОЕЕР может быть любым значением, допустимым для 
%516. Помните, что внутри обработчика сигнала нельзя гарантировать пра- 
вильную работу многих библиотечных вызовов С (особенно для стандартного 
ввода/вывода). Хуже того, сложно определить, какой код библиотеки С. каким 
кодом Ре! вызывается. (С другой стороны, многие из сигналов, которые пере- 
хватывает $191гар, довольно жестоки — они в любом случае уничтожат про- 
грамму, так что нет особого вреда в том, чтобы попытаться что-то сделать.) 


Предопределенные списки сигналов 


Прагма ѕідїгар имеет несколько встроенных списков сигналов: 
погта1-$19па1$ 


Сигналы, с которыми обычно может столкнуться программа и которые по 
умолчанию вызывают ее завершение. Это сигналы НОР, ІМТ, РТРЕ и ТЕВМ. 


еггог-519па15 


Сигналы, которые обычно указывают на серьезные проблемы в интерпретато- 
ре Ре! или в программе. А именно АВВТ, ВЏЅ, ЕМТ, ЕРЕ, 111, 0017, ЗЕб\, 5Ү5 и ТААР, 


ѕідїгар 961 


01а-іпіегғасе-5ідпг1ѕ 


Эти сигналы по умолчанию перехватывались в старой версии интерфейса 
зідїгар. Это сигналы АВАТ, ВИ, ЕМТ, ЕРЕ, 111, РІРЕ, ОУТТ, ЗЕбМ, $Ү5, ТЕВМ и ТВАР, Если 
в зе ѕідігар не передать конкретные сигналы или списки, используется имен- 
но этот список. 


Если на данной платформе не реализован некоторый сигнал, указанный в предо- 
пределенных списках, имя этого сигнала просто игнорируется. (Сам сигнал нель- 
зя проигнорировать, поскольку он не существует.) 


Прочие аргументы ѕісдігар 


оипігарред 


Подавляет установку обработчиков для сигналов, перечисляемых далее в спи- 
ске, если они уже перехватываются или игнорируются. 


апу 


Устанавливает обработчики для всех сигналов, перечисляемых далее в спи- 
ске. Это режим по умолчанию. 


ѕ1дпа1 


Любой аргумент, который выглядит как имя сигнала (т.е. соответствует шаб- 
лону /[А-2][А-20-9]*‹%/), запрашивает обработку этого сигнала прагмой ѕідїгар. 


питрег 


Числовой аргумент требует, чтобы номер версии прагмы $191гар был не мень- 
ше пипрег. Действует так же, как в обычных модулях, имеющих переменную 
пакета $УЕАЅІОМ: 


Х рег1 -Меїдїгар -1е '`ргіпі $5ідїгар: : УЕНЗТОК* 
1.02 


Примеры использования ѕЅідќгар 


Обеспечить трассировку стека для сигналов старого интерфейса: 
изе ѕідїігар; 
То же самое, но более явно: 
изе 3191гар дм(ѕїаск-їгасе о10-іпїегғасе-ѕідпа1ѕ): 
Обеспечить трассировку стека только для четырех перечисленных сигналов: 
иѕе ѕідїгар ди(ВУЗ ЅЕСУ РІРЕ АВВТ); 
Выполнить іе при получении сигнала ІМТ или 0017: 
изе ѕідігар дм(91е ІМТ (ИТ); 
Выполнить 0іе при получении любого из сигналов: НУР, ІМТ, РТРЕ или ТЕНМ: 
изе ѕідігар дм(діе погта1-ѕідпа15); 


Выполнить 01е при получении любого из сигналов: НУР, ІМТ, РІРЕ или ТЕНМ - нс не 
изменяя режим для сигналов, которые уже перехватываются или игнорируются 
в каком-либо месте программы: 


962 Глава 29. Модули прагм 


иѕе ѕідїгар дм(01е ипїгарред погта1-ѕідпа1ѕ); 


Выполнить 01е при получении любого из не перехватываемых в данный момент 
сигналов из списка погпа1-ѕідпа15; кроме того, обеспечить вывод трассировки сте- 
ка при получении любого из сигналов еггог-ѕідпа1«: 


изе ѕідігар дм(біе ипїгарред погта1-$19па1$ 
Ѕїаск-ігасе апу еггог-ѕідпа15); 


Установить подпрограмму пу һапд1ег в качестве обработчика для погта1-ѕідпа1: 
иѕе $101гар "Һап@1ег" /2> \&пу һап@1ег, “погта1-$10па1$”; 


Установить пу һапд1ег в качестве обработчика для погпа1-510па1$; обеспечить вы- 
вод трассировки стека при получении любого из сигналов еггог-ѕідпа1: 


изе ѕідтгар дм(пайд1ег ту _һапд1ег погиа1-310па1$ 
ѕсаск-їгасе еггог-$19па1$); 


50" 


До версии у5.8 встроенная функция 50г{ использовала алгоритм быстрой сорти- 
ровки (дисЁзог®. Этот алгоритм в худших случаях показывал квадратичную 
сложность и мог не сохранять первоначальный порядок следования элементов 
с одинаковыми значениями (т.е. проявлял нестабильность). Начиная с Рег у5.8 
по умолчанию применяется алгоритм сортировки слиянием (тегвеѕогі), который 
в худшем случае показывает производительность О(п [0# п) и сохраняет первона- 
чальный порядок следования элементов с одинаковыми значениями (т.е. прояв- 
ляет стабильность). 


Прагма ѕогї позволяет выбирать используемый алгоритм сортировки. И если ко- 
гда-нибудь по умолчанию будет использоваться другой алгоритм, отличный от 
алгоритма сортировки слиянием, вы сможете выбрать стабильную сортировку, 
не указывая конкретный алгоритм: 


иѕе ѕогї ‘этаб1е”; # гарантирует стабильность 

иѕе ѕогі "_дџіскѕогїі”; # использовать алгоритм быстрой сортировки 
изе зогЕ “ мегдезогт”; # использовать алгоритм сортировки слиянием 
изе ѕогї “дегаи1т$”; # вернуться к поведению по умолчанию 

по ѕогї “Табе”; # стабильность не имеет значения 


и3е ѕогі “_дѕогЕ” # синоним _диіскЅогЇ 
пу $сиггепї, 


ВЕСІМ { 
$сиггепі = ѕогі: :сиггепї( ); # идентифицировать господствующий алгоритм 


УЕ 


оиѕе зЕг1ст; # Установить все три структуры 


иѕе $Тгаст “магѕ”; # Переменные должны быть предварительно объявлены 
иѕе ѕїгісї “геЁз”; # Нельзя использовать символические ссылки. 
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изе ѕїгісї "ѕирѕ“; # Строки голых слов необходимо заключать в кавычки 


иѕе $1г1ст; # Установить все... 
по ѕігісї “\аг5”; # .затем отменить одну. 


изе м5. 12; # по умолчанию для \5.2.0 или выше 


Эта прагма с лексической областью видимости изменяет некоторые основные пра- 
вила, согласно которым Рен определяет, что является допустимым кодом. Иногда 
эти ограничения кажутся слишком строгими для простых задач, например, ко- 
гда мы просто пытаемся «слепить» программу-фильтр в пять строк. Чем больше 
программа, тем больше строгости необходимо проявлять по отношению к ней. 


В настоящее время строгости целесообразны по отношению к трем вещам: ѕибѕ, 
уагѕ и геЁз. Если список импорта не задан, предполагается установка всех трех 
ограничений. 


Ѕігісе "ге" 


Эта прагма генерирует ошибки этапа выполнения в случае применения символи- 
ческих ссылок, намеренного или случайного. 


Подробнее о них читайте в главе 8. 


иѕе ѕїгісі "геғѕ”; 


Фгеғ – \$ғоо; # Сохранить "настоящую" (жесткую) ссылку. 

ргіпі $$ геғ; # Разыменование допускается 

фгеғ = “Р00"; # Сохранение имени глобальной (пакетной) переменной. 
ргіпі $$гет, й НЕВЕРНО, ошибка этапа выполнения при Ѕїгісї геѓѕ. 


Символические ссылки подозрительны по ряду причин. Даже добропорядочные 
программисты могут на удивление легко допустить ошибочное их применение; 
прагма ѕїгісї "геғѕ” предохраннет от этого. В отличие от настоящих, символиче- 
ские ссылки могут относиться только к глобальным переменным. Для них не ве: 
дется учет числа ссылок. Часто есть способ лучше для решения этой задачи: вме- 
сто ссылки на имя в глобальной таблице имен используйте хеш как самостоя- 
тельную мини-таблицу имен. Это более эффективно, лучше читается и оставляет 
меньше возможностей ошибиться. 


Тем не менее некоторые виды допустимых действий в действительности требуют 
прямого доступа к таблице глобальных символов пакета для имен переменных 
и функций. Например, может потребоваться исследовать список @ЕХРОНТ или над- 
класс @5А некоторого пакета, имя которого заранее не известно. Либо может по- 
надобиться установить массу вызовов функций, каждый из которых является 
псевдонимом одного и того же замыкания. Это как раз то, для чего символиче- 
ские ссылки хороши, но, чтобы использовать их в области действия изе ѕїгісї, 
необходимо предварительно снять ограничение геѓѕ: 


# создать группу методов доступа к атрибуту 
Тог ту $тетћпате (дм/пате гапк ѕегпо/) { 
по 51г1Ссї “ге”; 
«Фпетһпате = зи6 { $ [0]->{ __РАСКАСЕ__ . $те+һпате } 
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Ѕгісё "маг$" 


При этом ограничении ошибка этапа компиляции возникает всякий раз при по- 
пытке доступа к переменной, которая не удовлетворяет хотя бы одному из сле- 
дующих критериев: 


• Предопределена в самом Рей, например @АВС\, ХЕМ и глобальные переменные 
с именами из знаков пунктуации, такие как $. или $. 


• Объявлена через оиг (для глобальной) или пу/ѕїаїе (для лексической). 


• Импортирована из другого пакета. (Прагма уагѕ подделывает импорт, но мож- 
но применить уг.) 


® Имеет абсолютное имя, включающее имя пакета и два двоеточия в качестве 
разделителя имени. 


Одного только оператора 1оса] недостаточно, чтобы удовлетворить изе $1г1ст 
"уагз", поскольку, несмотря на свое имя, этот оператор не изменяет глобальную 
область видимости переменной. Он просто дает переменной новое временное зна- 
чение до конца блока на этапе выполнения. Для объявления глобальной перемен- 
ной по-прежнему необходима директива сиг, а для объявления лексической пере- 
менной – пу или ѕїаїе. Однако оиг можно локализовать: 


1оса1 оиг $1ам = "тагііа1"“; 


На глобальные переменные, предопределенные в Рег, эти требования не распро- 
страняются. Это относится к переменным, глобальным для всей программы (ко- 
торые помещены в пакет паіп, подобно @АВСУ или $_) и к переменным пакета, та- 
ким как $а и $6, обычно используемым функцией ѕогї. Пакетные переменные, 
используемые модулями типа Ехрогїег, все же нуждаются в объявлении через сиг: 


сиг @ЕХРОВТ_ОК = дм(пате гапк ѕегпо), 


ЅігіСЕ "5иб5" 


Данное ограничение предписывает Рей считать все голые слова ошибками син- 
таксиса. Голое слово («Ъагеугога» или, в некоторых диалектах, «Беагуог4») явля- 
ется любым «голым» именем или идентификатором, для которого нет иной ин- 
терпретации, продиктованной контекстом. (Контекст часто диктуется соседним 
ключевым словом или лексемой либо предварительным объявлением рассматри- 
ваемого слова.) Традиционно голые слова интерпретировались как строки без ка- 
вычек. Данное ограничение делает такую интерпретацию незаконной. Если вы 
намерены работать с именем как со строкой, заключите его в кавычки. Чтобы ис- 
пользовать имя как вызов функции, необходимо предварительное объявление 
или применение круглых скобок. 


Особым случаем диктуемого контекста является появление голого слова в фигур- 
ных скобках, слева от оператора =>, которое рассматривается как заключенное 
в кавычки и потому не подпадает под данное ограничение. 


иѕе 5їг1сї "5008"; 


$х 
$х 


мпатеуег; # НЕВЕРНО: ошибка “голого слова“! 
мпатеуег( ), # А вот это всегда работает. 
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ѕир мһаїеуег; # Предварительное объявление функции. 
$х = мћаїеуег; # Теперь порядок. 


# Такое применение разрешено, поскольку => заключает в кавычки 
Упазй = (гед => 1, Б1ие => 2, дгееп => 3) 


$гедпит = $һаѕһ{ гед}; # ОК, фигурные скобки здесь закавычивают 


# А вот здесь нет: 


@соо1питѕ = @һаѕһ{Б1џе, дгееп}; # НЕВЕРНО: ошибка “голого слова”. 
@соо1питѕ = @Разв{“Б]ие”, “дгееп”}, # Порядок, слова теперь в кавычках. 
@соо1питѕ = ё@паѕћ{дм/010е дгееп/}; в Аналогично 

546$ 


и$е ѕирз дм/мапКеп Б1іпкеп поб/, 
@х = міпкеп 3.. 10; 
@х = поа б1іпкеп @х 


Объявляет все имена в списке аргументов как стандартные подпрограммы. Пре- 
имущество в том, что затем можно использовать эти функции без круглых скобок 
как списочные операторы, как если бы они были объявлены самим программи- 
стом. Это не всегда так же полезно, как полное объявление, поскольку делает не- 
возможным использование прототипов или атрибутов, таких как: 


зиб міпкеп(@); 
ѕир Б1іпкеп(\®@) : 1оскед; 
ѕир по9($) : 1ма10ие; 


Основанная на стандартном механизме импорта, прагма џѕе ѕирѕ имеет не лекси- 
ческую область видимости, а область видимости пакета. Это значит, что объявле- 
ния действуют во всем файле, где они упомянуты, но только в текущем пакете. 
Такие объявления нельзя отменить с помощью по ѕибѕ. 


Ұһгеааѕ 


В настоящее время Регі поддерживает две модели организации многопоточного 
выполнения. Одна из них — старая модель, реализованная в Рег! версии у5.005 
посредством модуля Тһгеабѕ, который был исключен в Регі версии у5.10. Вторая 
модель появилась в Рег версии у5.8 и называется «потоки интерпретатора» 
(іпђегргеѓег һгеайѕ, или іїһгеадѕ) – она запускает отдельный экземпляр интер- 
претатора Реті для каждого потока выполнения. Если вы знакомы с многопоточ- 
ными моделями в других языках программирования, забудьте о них — они не 
имеют ничего общего с многопоточной моделью в Рег1, кроме названия. 


Для использования прагмы {1геа$ необходимо, чтобы интерпретатор рей был со- 
бран с поддержкой потоков выполнения. Чтобы выяснить, так ли это, выполните 
команду рег! -\ и поищите в строках вывода нечто похожее нё ЏЅЕ ІТНАЕАРЅ в на- 
раметрах компилятора. Можно также воспользоваться модулем Сопѓіс, который 
позволяет получить параметры компиляции во время выполнения вашей про- 
граммы: 
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изе Соп{19; 
$Сопғіо{иѕеіїгеадѕ} 
ог діе( `Пересосерите Рег1 с поддержкой потоков, чтобы выполнить эту программу. "); 


Многие дистрибутивы Регі, распространяемые в составе операционных систем, 
уже обладают поддержкой многопоточной модели выполнения, т.к. проще вклю- 
чить эту поддержку для всех, чем выжать дополнительную производительность, 
отключив ее для всех, и выслушивать жалобы на отсутствие этой поддержки. 


Ниже приведен короткий пример. Он запускает несколько потоков выполнения, 
обособляет их, затем запускает заключительный поток и присоединяет его. Про- 
грамма не ждет завершения обособленных потоков выполнения, но она будет 
ждать завершения присоединенного потока. Потоки можно создавать с примене- 
нием ссылок на код или имен подпрограмм, а можно воспользоваться функцией 
азупс из прагмы їћгеай5: 


#1 /иѕг/ріп/рег1 
изе м5. 10; 


иѕе Соп{19; 
$Соп?ід{иѕеіїћгеабѕ} || діе “Требуется поддержка потоков для запуска“; 


иѕе іһгеайѕ; 


1їһгеайѕ->сгеаїе(ѕиб { 
му $10 = 1һгегдѕ->+ія; 
Ғогеасһћ (0 .. 10) { 
ѕ1еер гапда 5; 
зау “Мяу от кошки $10 (% )"; 
} 
})->детасһ; 


Рог (0. 4) { 
пу $1 = азупс { 
пу $19 = ЕАгеааз->19; 
Ғогеасћ (0 .. 10) { 
ѕ1еер гапа 5; 
зау “Гав от собаки $19 ($ _)" 
} 
} 
$1->детасн; 
гетигп $1; 
} 


їһгеааѕ->сгеате( "ога" )->7о1п; 
зуб біга { 
пу $14 = їһгеааѕ->?іа; 
Ғог (0. 10) { 
ѕ1еер гапа 5; 
ѕау “Чирик от птички $10 ($_)” 


} 


Дополнительную информацию о потоках выполнения можно получить на стра- 
нице регЁйгиш - учебнике по использованию потоков в Регі. В Рей предусмотрена 
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возможность совместного использования переменных в потоках выполнения по- 
средством їһгеаа::ѕћагей и общей очереди с помощью модуля Тйгеад$: :биеце. 


иғ8 


оиѕє и; 


Прагма 0118 объявляет, что исходный текст на языке Рег до конца лексической 
области имеет кодировку ОТЕ-8. Это позволяет использовать идентификаторы 
и строки, содержащие символы Юникода. 


иѕе иЇ#8; 
ту $гезите_пате = "Вјогк бибтипаѕдбттіг" 
{ 
по ив; 
пу $појіраке = У” # вероятно вызовет ошибку 
} 


Прагма ит#8 предоставляет также некоторые другие возможности, но в этом отно- 
шении мы рекомендуем отдавать предпочтение модулю Епсойе. 


Обратите внимание, что, начиная с Рег! версии у5.14, компилятор не нормализует 
идентификаторы, поэтому вы не сможете различать глифы, сформированные раз- 
ными способами (с использованием композиционных или декомпозиционных 
символов). Подробнее о нормализации рассказывается в главе 6. Мы рекомендуем 
нормализовать все идентификаторы в форму МЕС (или МЕКС), чтобы избежать ве- 
роятности появления разных переменных, имена которых выглядят одинаково. 


уаг$ 


изе уагѕ дм($#гоббеа @типде %зееп): 


Эта прагма, когда-то применявшаяся для объявления глобальных переменных, 
в настоящее время уступает место модификатору сиг. Предшествующее объявле- 
ние лучше записать так: 


оиг($#гоббеа, @типде, %ѕееп); 
или даже: 


оиг $#гоббеб = “Е”; 
сиг @типде = “А” $Егоббед; 
сиг %зееп = (); 


При любой форме записи помните, что прагма оџг объявляет глобальные пере- 
менные пакетов, а не лексические переменные файлов. 


мег оп 


изе уегзлоп 0.77; 


пу $мегѕіоп = мегз1оп->рагзе( $мегз1оп_$1г1п9), 
ту $9мегѕіоп = ду($0їһег мегѕіоп_ѕїгіпо); 
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ЇР ($уегѕіоп > $дуегѕіоп) { 
зау “Мегѕіоп 15 угеаїег! "; 


} 


В действительности модуль уегѕіоп прагмой не является, но выглядит как праг- 
ма, потому что его имя состоит только из символов нижнего регистра. До версии 
у5.10 модуль мегѕіоп предоставлял способ заключать версии в кавычки с помо- 
щью оператора 49\() и способ сравнивать номера версий. Может показаться, что 
в этом нет ничего сложного, но стоит погрузиться в решение этой задачи, можно 
даже усомниться в своих способностях к программированию. Например, в каком 
порядке выходили версии 1.02, 1.2 и у1.2.0? Теперь Рег! способен решать эту зада- 
чу самостоятельно. Однако от этого она не стала проще!. 


уі 


иЅЄ УП51$П; # все возможности 


и5е утѕіѕһ “ех1{”; 
иѕе ут$1$й “пизНед”; 
и5е утѕіѕћ "ѕіаїиѕ”; 
иѕе утѕіѕћ "1те"; 


по утѕіѕћ "һиѕћес ': 
упѕіѕћ: : һиѕћед($биѕһ), 


и5е утѕіѕћ; # все возможности 
по Уп515ћ “тіпе"; # отключить ‘іте 


Прагма \15131 управляет некоторыми возможностями Рей, ориентированными 
на УМ$, чтобы ваши программы меньше напоминали программы для ОМІХ 
и больше — для УМ$. Эти возможности имеют лексическую область видимости, 
благодаря чему вы можете включать и отключать их по мере необходимости. 


ехії 


При включенной возможности ехії оба вызова, ехії 1 и ехії 0, отображаются 
в значение 5Ү5$№ОВМА!, свидетельствующее об успешном завершении. В интерпре- 
тации ОМХ вызов ехії 1 говорит об ошибке. 


һиѕһеа 


Если включить һиѕћей, программа на Регі, запущенная из ОСИ, не выводит сооб- 
щения в 5\5$00ТРИТ или 5ҮЅ$ЕЋАОЯ, завершаясь с ошибкой. Однако эта прагма не 
подавляет вывод сообщений от самой программы. Она воздействует только на 
функции ехії и іе в лексической области видимости, и только на те, что будут 
скомпилированы после того, как встретится эта прагма. 


і Вам определенно понравится статья Дэвида Голдена (рауіа Со!еп) «Уегѕіоп пштђегѕ 
зћһоша Бе Бога» (ћёёр://оило.Павоійеп.сот/іпӣех.рћр/369/оегѕіоп-питрегѕ-зћоиша-Бе-Бо- 
гіпо/). 
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ѕ{аїиѕ 


Если включить зїаїџѕ, в качестве возвращаемого значения функции зузтеп и зна- 


чения переменной $? используется код завершения УМБ, а не код завершения 
РОЗІХ. 


{те 


После включения этой возможности все временные значения будут откладывать- 
ся относительно локального часового пояса, а не относительно Опіуегѕа1 Тіпе, 
используемого по умолчанию. 


" 
ммагпто$ 

и$е магп1п0$; # то же, что импорт “всех” 

по магпіпд5, # то же, что отмена импорта “всех” 


иѕе магп1пд$з: : гедіѕтег; 
1 (магп1п93: :епаб1ед()) { 
магп1 пд: :магп( "зоте магп1по”) 


1 (магп1лд$: :епарлеа("моїа”)) { 
магп1п93: :магп("моід”, “зоте магпапд”); 


магп1п95: :магпі?( "Магпіпоѕ аге оп"); 
магпіпдх: :магпі?( "питрег”, “Ѕопеїһіпо 1$ игопд міїћ а питоег”); 


Эта прагма с лексической областью видимости допускает гибкое управление встро- 
енными предупреждениями Регі, выдаваемыми как компилятором, так и систе- 
мой времени выполнения. 


Когда-то управлять обработкой предупреждений в программе Рег. можнс было 
только с помощью параметра командной строки -и или переменной $. Это по- 
лезно, но это подход «все или ничего». Применение ключа -и приводит к выводу 
предупреждений для кода модулей, которые могли быть написаны кем-то дру- 
гим, что может озадачивать вас и смущать первоначального автора. Применение 
$^И для включения или выключения сообщений в блоках кода может оказаться 
не очень удачным, поскольку действует только на этапе выполнения, а не во вре- 
мя компиляции. Другая проблема состоит в том, что эта глобальная для всей 
программы переменная имеет динамическую, а не лексическую область видимо- 
сти. Это означает, что если мы включаем ее в блоке, а затем вызываем из него дру- 
гой код, то снова рискуем включить вывод предупреждений в коде, который раз- 
рабатывался без следования точным стандартам. 


Прагма магпіпоѕ обходит эти ограничения, поскольку является механизмом этапа 
компиляции с лексической видимостью, позволяющим осуществлять тонкий 
контроль над тем, где следует, а где не следует — выводить предупреждения. Опре- 
делена целая иерархия категорий предупреждений (рис. 29.1), обеспечивающая 


1 Если, конечно, нет блоков ВЕСІМ. 
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независимое включение и выключение групп предупреждений. (Деление на кате- 
гории является экспериментальным, так что может измениться.) Эти категории 
можно объединять, передавая в џѕе или по несколько аргументов: 


ие магпіпоѕ дм(уо10 гедеҒіпе), 
по магпіпдѕ ом(іс ѕупіах ипїіе); 


ериддіт(отладка) 
! 
іаріасе (на месте) 
! 
т - 


вхес /выполненив) 8 


110 (ввод/вывод) | 
610564 (закрыто) 


0100 ск файлов) 


| ітргѓесіѕ1оп (Неточность) | 


[тіс (разное) | питепс (численные) | [злое 
ее 


опсе (спнократное) \ | 


1 
„Г твсогяюл (рекурсня]] 


ипраск (распаковка 


РА АА Гопбе (отвязывание)| 


| ипілійајігед (не инициализировачо)| С 
В 


гедвх регулярнь 


7 < 


теѕегуей {зарезервировано) 


| Ом (кавычки) | 


втісоіоп (точка с залят | 
ргоѓоуре (прототип 


Рис. 29.1. Категории предупреждений Рей 
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Если в области видимости несколько экземпляров прагмы магпіпдѕ, их действие 
суммируется: 


иѕе магпіпдѕ "моіа";, # Включена только категория \010”. 
изе магп1поѕ “10”; # Включены категории “уо1а’ и "10". 
по магп1109$ “\019”; # Включена только категория “10” 


Чтобы превратить предупреждения, включаемые некоторой прагмой иагп1пд$, 
в фатальные ошибки, предварите список импорта словом ГАТА(. Это удобно, если 
требуется, чтобы некоторое условие, обычно вызывающее предупреждение, пре- 
рывало выполнение программы. Допустим, например, что мы считаем использо- 
вание неподходящей строки в качестве числа (которое обычно в этом случае при- 
нимает нулевое значение) совершенно недопустимым и хотим, чтобы это возмути- 
тельное событие прерывало программу. Попутно мы решили, что использование 
неинициализированных значений там, где ожидаются действительные строки 
или числа, тоже должно приводить программу к немедленному самоубийству: 


{ 
изе магп1пдз РАТАЕ => дм(питег1с ип1п111а117е9), 
$х = $у + $2; 

} 


Теперь, если $у или $ не инициализированы (т.е. содержат особое скалярное зна- 
чение ипе?) или содержат строки, которые не очень хорошо преобразуются в чис- 
ла, то вместо того, чтобы безмятежно двигаться дальше или, самое худшее, слег- 
ка пожаловаться, если включен вывод предупреждений, наша программа возбу- 
дит исключение. (Представьте себе Ре, работающий в режиме Руіћоп.) Если не 
обеспечить перехват исключительных ситуаций, эта ошибка станет фатальной. 
Текст исключительной ситуации тот же, что появился бы в обычном предупреж- 
дении. 


Сделать фатальными все предупреждения, сказав в начале программы: 
џѕе магпіпдѕ РАТАЁ => "а11`; 


не самое лучшее решение, потому что прагма не различает предупреждения эта- 
пов компиляции и выполнения. Первое же сообщение компилятора наверняка 
разойдется с вашими ожиданиями, но, если все предупреждения объявить фа- 
тальными, только это сообщение вы и увидите. Лучше отложить превращение 
предупреждений в фатальные ситуации до этапа выполнения. 


иѕе Сагр дм(сағр сгоак сопѓеѕѕ с1иск); 
иѕе магп1пдз; # предупреждения этапа компиляции 


# во время выполнения, перед всем остальным 
$516{__МАВМ__} = зи6 { сопРезз “РАТАГТРЕО МАВМІМ№: © ” } 


Альтернативное решение заключается в использовании С1иск вместо сопѓеѕѕ. 
В этом случае точно так же будет выводиться дамп стека, но программа будет 
продолжать работать. Это может пригодиться при поиске в коде путей, ведущих 
к появлению предупреждений. Читайте описание хеша %51С в главе 25, где приво- 
дятся дополнительные примеры. 
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Прагма магпіпдѕ игнорирует ключ командной строки -ш и значение переменной 
$`и; настройки самой прагмы имеют более высокий приоритет. Однако ключ ко- 
мандной строки -Й’ отменяет прагму, включая полный вывод предупреждений 
во всем коде программы, даже в том, который загружается с помощью йо, гедиіге 
или изе. Иными словами, с ключом -Й’ интерпретатор Рег! действует так, как ес- 
ли бы в каждом блоке программы присутствовала прагма иѕе магпіпоѕ “а11”. 


Существует несколько вспомогательных функций для тех авторов модулей, кото- 
рые хотят, чтобы их функции в модулях вели себя как встроенные функции в от- 
ношении лексической области видимости вызвавшего их модуля (другими слова 
ми, чтобы пользователи модуля имели возможность лексически включать и от- 
ключать предупреждения. которые может выводить модуль): 


магпіпозѕ::гедіѕтег 
Регистрирует имя текущего модуля как новую категорию предупреждений, 


чтобы пользователи модуля могли выключать поступающие от него предупре- 
ждения. 


магпіпоѕ: :епар1ед(сАТЕСОВҮ) 


Возвращает истинное значение, если категория предупреждений САТЕСОВҮ вклю- 
чена в лексической области видимости вызывающего модуля. В противном слу- 
чае возвращает ложное значение. Если САТЕСОРУ не указана, используется имя 
текущего пакета. 


магп1п9$: :магп(САТЕСОВУ, МЕЗЗАСЕ) 


Если вызывающий модуль не устанавливает САТЕСОВУ как ГРАТА! , функция вы- 
водит МЕЗЗАСЕ в ЭТОЕВВ. Если САТЕСОВУ установлена как ГАТА|, выводит МЕЗЗАСЕ 
в ЭТОЕНА, после чего программа завершается. Если САТЕСОРУ не указана, исполь- 
зуется имя текущего пакета. 


магп1п9з: маги (САТЕСОВУ. МЕЗЗАСЕ) 


Действует подобно функции магп1п95::магп, но только если категория САТЕСОВУ 
включена. 


Пользовательские прагмы 


В Рен у5.10 появилась возможность создавать собственные прагмы с лексиче- 
ской областью видимости. Хеш % Н содержит информацию, которая может ис- 
пользоваться другим программным кодом для получения подсказок о том, что вы 
собираетесь сделать, а функция са11ег принимает ссылку на версию этого хеша, 
действительную для запрашиваемого уровня: 


пу $һіпіѕ = ( са11ег(1) )[10]; 


Это простой хеш с простыми значениями. Если не вдаваться в подробности, этот 
хеш может совместно использоваться несколькими потоками выполнения. Он 
устроен так, что исключает возможность хранения любых значений, кроме це- 
лых чисел, строк и иподег. Это не явлнется большим ограничением, так как в дей- 
ствительности вам достаточно лишь знать, включена или выключена та или иная 
возможность. Кроме того, данный хеш имеет лексическую область видимости, 
поэтому каждая лексическая область получает собственную версию хеша. 
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Чтобы создать собственную прагму, определите три подпрограммы: ітрогї, џпітрогї 
и іп еѓѓесї. Первые две вызываются неявно, директивами ие и по. Обычно дирек- 
тива и5е включает возможность вызовом функции іпрогї, тогда как по отключает 
эту возможность, вызывая функцию џпіпрогї. Помимо специальных операций, 
функции 1прог{ и џпіпрогї устанавливают флаг в %`Н. Другой программный код, 
находящийся за пределами прагмы, может вызывать іп еѓѓесї, чтобы опреде- 
лить, действует ли прагма, а функция может обращаться к хешу %`Н, чтобы полу- 
чить установленное вами значение. 


Нет каких-то строгих правил, регламентирующих, что можно добавлять в хеш 
"Н, но не забывайте, что другие прагмы тоже пользуются этим хешем для выпол- 
нения своей работы, поэтому выбирайте ключи, которые наверняка не будут ис- 
пользоваться другими прагмами, как, например, имя вашего пакета. 


Ниже представлен короткий пример прагмы, замещающей встроенную функ: 
цию $4г1 другой, способной обрабатывать отрицательные числа (грубо). Директи- 
ва изе сотр]ех вызовет метод ітрогї, который добавит в %`Н ключ сопр1ех со значе- 
нием 1 и создаст подпрограмму с именем 59гї, использующую то же определение, 
что и сопрех: :сотр]ех_заг+. Функция сопр1ех_$9гї вызывает метод іп еѓѓесї, что- 
бы определить, допускается ли извлекать корень из отрицательных чисел. В этом 
случае она извлекает квадратный корень из абсолютного значения и, если исход- 
ное значение меньше 0, добавляет "1" к результату: 


иѕе ит?8; 
и5е У5. 10; 


раскаде сотр1ех; 
иѕе ѕїгісї; 

џѕе магпіпд5: 
изе Сагр; 


зиб сотр1ех_$9гї { 

ту $питбег = 5ћіҒТ, 

іЁ (сотр1ех::іп еѓғесі()) { 
пу $гооф = СОВЕ: : ѕдгі(аоѕ(Фпџитрег)); 
$гоої .= ^1" 1 Фиитбег < 0; 
гефигп $гоот; 

} 

е15е { 
сгоак( "Невозможно выполнить з9г® для $питбег”) і? Фпитбег < 0; 
СОВЕ: : ѕдгі(Фпипбег) 


ѕиб 1троге { 
$^Н{сотр1ех} = 1, 
ту(Фраскаде) = (са11ег(1))[0], 
по ѕігісї "геїѕ”; 
*{ "${раскаде)} ::ѕдгі” } = \&сотр1ех: :сотр1ех_здгї; 


ѕир ипітрогї { 
$7Н{сотр1ех} = 0, 
} 
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зир 1п_еРРест { 
ту $һіпіѕ = (са11ег(1))[101; 
гетигп $һіпѕ->{сотр1ех}; 


} 
1; 
Ниже приводится фрагмент программы, создающей комплексные числа: 


иѕе ит; 
иѕе %5. 10, 
изе сотр1ех; 


зау "1. ү-25 13 " => загЕ(-25), 
зау "2. \36 13 “ => ѕдгі( 36); 


е\а1 { 
по сотр1ех; 


зау "3. \-25 1$ " => ѕдгі(-25): 
зау "4. 136 18 " => ѕдгі( 36); 
} ог ѕау "Еггог: $6"; 


Директива по сотр1ех сбрасывает флаг $^Н{сотріех}, запрещая извлечение квадрат- 
ного корня в оставшейся области видимости. Хеш %`Н имеет лексическую область 
видимости, поэтому после выхода из блока будет восстановлено прежнее значе- 
ние. Внутри блока ехуа1 директива по сопр1ех выключает специальную обработку, 
поэтому 50г1(-25) вызовет ошибку: 


1. у-25 1$ 51 
2. 36 іѕ 6 
Еггог: Невозможно выполнить 59г для -25 аї ѕдгі.р1 1іпе 10 


Это упрощенный пример, модуль Маїћ::Сопр1ех лучше справится с извлечением 
корней из отрицательных чисел, даже если использовать его непосредственно, 
а не прятать за прагмой. 


Глоссарий 


Если мы выделяем здесь курсивом слово или фразу, это обычно означает, что мож- 
но найти их определение в этом глоссарии. Рассматривайте это как гиперссылку. 


АКСУ 


Имя массива, содержащего вектор аргу- 
ментов из командной строки. Когда мы 
применяем пустой оператор <>, АҢОУ слу- 
жит именем дескриптора файла, исполь- 
зуемого при обходе аргументов, и одновре- 
менно скаляра, содержащего имя текуще- 
го входного файла. 


АБЅСП 


А тегісап Зќапаага Сое ог шогтайоп 
Пуцегсрапее — американская стандартная 
кодировочная таблица (набор семиразряд- 
ных символов, пригодный только для огра- 
ниченного представления английского тек- 
ста). Часто произвольно используется для 
описания младших 128 значений различ- 
ных наборов символов 150-8859-Х — горст- 
ки взаимно-несовместимых восьмиразряд- 
ных кодов, которые лучше всего описать 
как полу-АЅСП. См. также Юникод. 


АУ 


Сокращение от «аггау уајие» — «значение 
типа массив», относящееся к одному из 
внутренних типов данных Регі, который 
содержит массив. Тип АУ является подклас- 
сом 57. 


аук 

Термин, используемый при редактиро- 
вании, — от «аукуагд» (неуклюжий). По 
совпадению также обозначает почтенный 
язык обработки текста, из которого Ре 
позаимствовал некоторые идеи высокого 
уровня. 


ВІОСК 


Синтаксическая конструкция из после- 
довательности инструкций Рей, заклю- 
ченной в фигурные скобки. Команды М 
и ие, например, определяются в терми- 
нах блоков. Иногда мы также называем 
«блоком» лексическую область видимости, 
т.е. последовательность инструкций, дей- 
ствующих как блок, например внутри е\а1 
или файла, даже если команды не заклю- 
чены в фигурные скобки. 


Вѕр 


Психотропный наркотик. популярный 
в 80-е годы, разработанный, вероятно, 
в университете Беркли или его окрест- 
ностях. Во многом аналогичен лекарству 
«буѕќет У», доступному только по рецеп- 
ту, но несравнимо более полезен. (Или, 
как минимум, сильнее веселит.) Полное 
химическое название: «Вегкееу Ббіапдага 
Ріѕігірибіоп». 


С 


Язык, который многие любят за его вывер- 
нутые наизнанку определения типов, не- 
постижимые правила приоритетов и зна- 
чительную перегрузку механизма вызова 
функций. (На самом деле, изначально про- 
граммисты начали переходить на С, обна- 
ружив, что идентификаторы в нижнем ре- 
гистре читаются легче, чем в верхнем.) Рег 
написан на С, поэтому не удивительно, что 
Рей позаимствовал из С некоторые идеи. 
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СОРЕ 


Слово, возвращаемое функцией геѓ в слу- 
чае применения ее к ссылке на подпро- 
грамму. См. также СУ. 


СРАМ 


Сотргеһепѕіуе Рег Агсһіуе МъМеімогКк – ар- 
хив Рег! (подробности читайте в предисло- 
вии, а также в главе 19). 


СУ 


Внутреннее определение типа «значение 
кода», содержащее подирограмму. Тин (У 
является подклассом 5У. 


ОВМ 


Обозначает программы «Рафа Вазе Мапаве- 
тепё» – управления базами данных, эму- 
лирующие в совокупности ассоциативный 
массив с помощью дисковых файлов. Про- 
граммы используют схему динамическо- 
го хеширования для нахождения любой 
записи за два обращения к диску. Файлы 
ОВМ позволяют программе Рен сохранять 
постоянный хеш между запусками. Вызо- 
вом їіе можно связывать переменные типа 
хеш с различными реализациями ОВМ. 


дуеотег 


Колдовство, иллюзия, фантом, фокусни- 
чество. Употребляется, когда в Рег! ма- 
гические эффекты, которые производит 
ашіттег, отличаются от тех, на которые 
вы рассчитывали, и кажутся результатом 
таинственного колдовства и вмешательст- 
ва нечистой силы. [От староанглийского.] 


Чупитег 


БУМ служит акронимом для «ро Мһаі І 
Меап» – делай, что я подразумеваю, прин- 
ципа, согласно которому нечто должно 
выполнить то, чего вы хотите, не подни- 
мая лишнего шума. Код, который дейст- 
вует таким образом. «Двимминг» может 
потребовать большого объема закулисной 
магии, которая (если она не остается над- 
лежащим образом сокрытой) называется 
ашеотег. 


еѕсаре-последовательность — 
еѕсаре ѕедиепсе 


См. метазнак. 


ехес 

Оставить программу текущего процесса 
и заменить ее другой, не завершая теку- 
щий процесс и не освобождая захваченные 
ресурсы (кроме прежнего образа в памяти). 


{еерше сгеафиг15т 


Перевертыш от фразы «сгееріпє Ё{еафи- 
гіѕт» (ползучий улучшизм)!, означает био- 
логическую потребность постоянно добав- 
лять в программу новые возможности. 


ЕІҒО 


Еігѕё т, Еігѕі Ои — «первым пришел, пер- 
вым ушел». См. также РО. Кроме того, 
прозвище для именованных каналое. 


Гео 

Поиск имен файлов с помощью групповых 
символов, или масок («\Пасагд»). См. опи- 
сание функции 0106. 


ЕМТЕУЕМ/ТК. 


Еаг Моге Тһап Еуегу ие Уоц Еуег Мап- 
ќеа То Кпом- намного больше, чем все, 
что вам когда-либо требовалось узнать. Ис- 
черпывающий трактат по какой-либо уз- 
кой теме, нечто вроде сверх-ЧаВо. Гораздо 
больше можно узнать у Тома. 


сш 


Идентификатор группы ~ в ОШХ исполь- 
зуется операционной системой для иден- 
тификации вас и членов вашей группы. 


оь 


Строго говоря — символ * интерпретатора 
команд, соответствующий єглобу» (группе) 
символов, используемый с целью сгенери- 
ровать список имен файлов. Вольно гово- 
ря – собственно применение глобов и ана- 
логичных символов для поиске по шабло- 
ну. См. также {Деов и пурейоёб. 


* Постоянное усложнение программы за счет мелких и ненужных улучшений. При этом не 
всегда улучшения ненужные! Другое дело, что они размывают изначальное видение и пони- 


мание программы. – Прим. перев. 
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Бтер 

Происходит от старой команды редактора 
ОМІХ «Сіорацу ѕеагсһ юг а Кесшаг Ех- 
ргеѕѕіоп апа Ргіпі ії» (глобальный поиск 
по регулярному выражению и вывод ре- 
зультатов). Сейчас используется в общем 
смысле поиска любого вида, особенно в тек- 
сте. В Реп есть встроенная функция дгер, 
которая ищет в списке элементы, удовле- 
творяющие любому заданному критерию, 
тогда как программа &гер(1) ищет в одном 
или нескольких файлах строки, соответст- 
вующие регулярному выражению. 


СҰ 


Внутреннее определение типа «значения 
210», содержащее ѓуреғїоБ. Тип 6\ являет- 
ся подклассом 5И 


НУ 


Сокращенно от определения типа «һаѕћ 
уаше», в котором содержится внутреннее 
представление хеша в Рен. Тип НУ является 
подклассом 8У. 


1/0 
Ввод/вывод, связанный с файлом или уст- 
ройством. 


то 


Внутренний объект ввода/вывода. Может 
также обозначать косвенный объект (іпді- 
гесі објесі). 


Ір 


Іпіегпеё Ргоќѓосоі, или ІпёеПесёџаі Ргорегіу 
(интеллектуальная собственность). 


ІРА 


11а Рае АІе (индийский светлый эль). 
А также Пцегпайопа! Рћопеііс АірһаБеї 
(международный фонетический алфавит, 
МФА), стандартный алфавит, используе- 
мый во всем мире для записи транскрип- 
ции. Много заимствует из Юникода, вклю- 
чая многие комбинационные символы. 


ТРС 


Межпроцессное взаимодействие (Пфегрго- 
сезз Соттипісаііоп). 
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ГУ 


Число четыре, не путать с эх, любимым 
редактором Тома. ГУ означает также Іпіе- 
вег Уаше (целочисленное значение) — внут- 
реннее целочисленное значение типа, ко- 
торый может содержаться в скаляре, не 
путать с МУ. 


ЈАРН 


«Јиѕі Апо ег Рег Наскег» («еще один ха- 
кер Рец»). Заумный, но таинственный 
фрагмент кода Рей, который в результате 
выполнения дает эту строку. Часто исполь- 
зуется для иллюстрации некоторой воз- 
можности Реп] и представляет собой что-то 
вроде постоянного конкурса на самый непо- 
нятный код на Регі в конференциях Озешх. 


ІЛҒО 


Таз Ір, Еігѕі Ои – «последним пришел, 
первым ушел». См. также ЕГРО. ЦЕО обыч- 
но называется стеком. 


[уашаЫе 


Способный служить левосторонним зна- 
чением. 


Макее 


Файл, управляющий компиляцией про- 
граммы. Программам на Рег обычно не 
требуется МакеЦе- у компилятора Ре 
имеется масса средств самоуправления. 


тап 


Программа ОМХ, которая выводит элек- 
тронную документацию (страницы руко- 
водства). 


тіпісрап 
Зеркало СРАМ, содержащее только послед: 


ние версии дистрибутивов. Возможно, соз- 
данное с помощью СРАМ: :Міпі. См. главу 19. 


топұбег 


Краткое обозначение члена группы поль- 
зователей Рег! (Рей Мопєег). 


тго 
См. порядок разрешения методов. 
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Мам 


Моё а питЪег (не число). Значение, исполь- 
зуемое в Ре для представления некото- 
рых недопустимых или невыразимых ре- 
зультатов операций с плавающей запятой. 


МЕБ 


Меімогк ЕПе Буфет – сетевая файловая 
система, позволяющая монтировать уда- 
ленную файловую систему, как если бы она 
была локальной. 


МУ 


Сокращение от «Невада», ни одна часть 
которой никогда не будет спутана с циви- 
лизацией. МУ означает также МъМитегіс \а- 
ше (числовое значение) — внутреннее пред- 
ставление числа с плавающей запятой ти- 
па, который может содержаться в скаляре; 
не путать с ГУ, 


рай 


Сокращение от ѕсғаісһрай – временная па- 
мять. 


РАТН 


Список каталогов, где система ищет про- 
грамму, которую нужно выполнить. Этот 
список хранится в одной из переменных 
среды, которая доступна в Рег! под именем 
Ф$ЕММДРАТН}. 


РАСЕ 


Ре Аџіһогѕ ОрІоаа БЕгуег (№Ир://раизе. 
регі.огв) – ворота для модулей в СРАМ. 


Реті топрегѕ 


Группа пользователей Регі, получившая 
свое название по наследству от «Мем Үогк 
Рег топсегѕ» — первой группы пользова- 
телей Ре]. Поищите ближайшую к себе 
группу на сайте ћѓір://илош.рт.оге. 


Регп 


Именно это получится, если выполнить 
Рег1++ дважды. Выполнив один раз, вы за- 
вьете себе волосы. Вам придется выпол- 
нить это восемь раз, чтобы вымыть воло- 
сы. Намылить, смыть, повторить. 


ро 

Разметка, используемая для встраивания 
документации в код Рег!. Название Род про- 
исходит от «Раш о йоситепѓаііоп» (про- 
стая старая документация). См. главу 28. 


РОЅІХ 

Спецификация переносимого интерфейса 
операционных систем (РогіаЫе Орегаёіпе 
Бузфет Іпфегѓасе). 


рр 

Внутреннее сокращение для кода «ривћ- 
рор», т.е. кода на С, реализующего меха- 
низм стеков Рег]. 


рипркіпс 

Обладатель тыквы — лицо, ответственное 
за работу насоса, или, по крайней мере, за 
его запуск. Время от времени играет роль 
Большой Тыквы. 


РУ 


«роіпїег уаше», на внутреннем наречии Рег! 
означает спаг*. 


гебех 
См. регулярное выражение. 


КЕС 


Кедиеѕі Рог Соттепї (просьбғ прокоммен- 
тировать) – несмотря на звучащую в на- 
звании робость, является названием ряда 
важных стандартизирующих документов. 


гооё 

Суперпользователь (010 == 0). Кроме того, 
каталог файловой системы самого верхне- 
го уровня («корень»). 


ЕТЕМ 


Это произносят, когда хотят, чтобы вы про- 
чли руководство – Веад Тһе Еіпе Мапиа]. 


КУ 


ВУ означает внутреннее ссылочное значе- 
ние (Кеѓегепсе Уаіие) типа, который может 
содержаться в скаляре. Если вы еще не за- 
путались, см. ГУ и МУ. 


' Здесь обыгрываются слова Регп (осоед), Регт (перманент, завивка), Регі (название шампу- 


ня). — Прим. перев. 
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ѕегірі Кіааіе 

Взломщик, который не хакер, его знаний 
хватает лишь для запуска сценариев. Не 
разбирающийся в сути (са’Ео-сий) про- 
граммист. 


ѕеа 


Уважаемый редактор Ѕігеат ЕЮійог, из ко- 
торого Рег] позаимствовал некоторые свои 
идеи. 


ела 
То же, что зени4, только относящееся к от- 
даче прав группы. 


зейиа 


Обозначает программу, работающую с пра- 
вами своего владельца, а не того, кто ее за- 
пустил (как обычно бывает). Также обо- 
значает один из флагов режима (битов 
разрешений), который управляет этой воз 
можностью. Этот бит должен быть явно 
установлен владельцем, чтобы включить 
данную функцию, а программа должна 
быть аккуратно написана, чтобы не дать 
больше прав, чем это необходимо. 


ѕһеБапЕ 


В культуре Рей слово-гибрид, образован- 
ное из «зһагр» (диез) и «Бапё» (восклица- 
тельный знак), обозначающее последова- 
тельность #!, которая сообщает системе, 
где найти интерпретатор команд. 


Ту) 


Считать весь файл в строку за одну опера- 
цию. 


ЭТРЕВВ, 


См. стандартное устройство вывода оши- 
бок. 


5ТОИХ 
См. стандартное устройство ввода. 


5ТОЮ 
См. стандартный ввод/вывод. 


5ТООТ 
См. стандартное устройство вывода. 
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ѕігисё 


Ключевое слово, вводящее определение или 
имя структуры. 


БҰ 


Сокращение для «ѕсаіаг уаіџе» — скалярное 
значение. Но в интерирегаторе Ре! любой 
объект ссылки рассматривается как член 
класса, производного от БУ, в объектно- 
ориентированном порядке вещей. Каждое 
значение внутри Рег передается как ука- 
затель 5\* на языке С. зігисі ЗУ знает свой 
собственный «тип объекта ссылки», а код 
достаточно сообразителен (надеемся), что- 
бы не пытаться вызывать функцию хеша 
с подпрограммой. 


ТСР 


Сокращение от Тгапѕтіѕѕіоп Сопёго! Ргоќёо- 
со] – протокол управления передачей дан- 
ных. Протокол, служащий оболочкой для 
Пиуегпеё Ргоѓосої, которая заставляет не- 
надежный механизм передачи пакетов вы- 
глядеть для прикладной программы как 
надежный поток байтов. (Обычно.) 


ТМТО\УТЫ 


Тһеге'ѕ Моге Тһап Опе Мау То Оо Н! - есть 
более одного способа сделать это — девиз 
Реп. Идея о том, что может найтись более 
одного допустимого способа решения рас- 
сматриваемой задачи программирования. 
(Это не значит, что «больше» всегда «луч- 
ше» или что всевозможные пути одинако- 
во желательны, — просто не должно быть 
Единственно Правильного Пути.) 


фто 


Почтенный наборный язык, из которого 
Рег взял название своей переменной $% 
и который тайно используется при наборе 
книг серии Сате|. 


їуредеѓ 
Определение типа в языке С. 


їуреғ1оЬ 

Использование одного идентификатора 
с префиксом +. Например. *папе замеща- 
ет любое имя из списка $папе, @пате, Хпате, 


1 Или «Все верблюды идут в Рим». — Прим. ред. 
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&папе, или просто папе, или все перечислен- 
ные имена одновременно. Как он будет ин- 
терпретироваться – как одно имя или как 
все имена, — зависит от контекста его при- 
менения. См. раздел «Таблицы символов 
и дескрипторы файлов» в главе 2. 


фурешар 

Описание преобразований типов на языке 
С втипы на языке Рег] и обратно в модуле 
расширения, написанном на Х5. 


Орр 


Оѕег Раќаргат Ргофосо], типичный способ 
отправки датаграмм через Интернет. 


ош 


Идентификатор пользователя. Часто ис- 
пользуется в контексте владения файлом 
или процессом. 


отаѕк 


Маска для тех битов разрешений, кото- 
рые должны быть сброшены при создании 
файлов и каталогов, чтобы установить по- 
литику для тех, кому мы обычно отказы- 
ваем в доступе. См. функцию ипаѕк. 


ОМІХ 


Очень большой и постоянно развивающий- 
ся язык, имеющий несколько вариантов 
во многом несовместимого синтаксиса. 
На этом языке любой может выразить все 
тем способом, каким пожелает, что обыч- 
но и делает. Владеющие этим языком счи- 
тают, что его легко освоить, поскольку его 
так легко приспособить к собственным це- 
лям, но различия в диалектах делают меж- 
племенное общение почти невозможным, 
и путешественники часто ограничиваются 
подмножеством языка типа пиджин-инг- 
лиш. Чтобы быть понятым всюду, автор 
сценариев интерпретатора команд ОМІХ 
должен посвятить годы обретению мастер- 
ства. Многие бегут от этой кары и общают- 
ся на языке, который подобен эсперанто 
и называется Регі. 


В древние времена ОМТХ использовался 
также для обозначения некоторого кода, 
который пара человек из Вей ГаЪз написа- 
ли, чтобы найти применение компьютеру 
РОР-1, который тогда ничем особенным не 
занимался. 


у-строка — у-ѕігіпе 

Строка «версии», или «вектор», задавае- 
мая как \ с последующими десятичными 
целыми в точечной нотации, например 
у1.20.300.4000. Каждое число преобразу- 
ется в символ с заданным порядковым зна- 
чением (если чисел не менее трех, символ \ 
может отсутствовать). 


\МУ5ГУУС@ 


УЋаё Уоц Бее 13 Маё Уоц Сеё- что ви- 
дашь, то и получишь. Обычно употребля- 
ется, когда нечто, представленное на экра- 
не, соответствует тому, как оно будет вы- 
глядеть в конечном итоге, например объ- 
явления Ғогпаї в Ре]. Также обозначает 
противоположность волшебству, если все 
работает точно так, как выглядит, напри- 
мер в ореп с тремя аргументами. 


х$ 


Невероятно экспортируемый, чудо какой 
великолепный, необычайно выразитель- 
ный новый язык расширения для созда- 
ния внешних подпрограмм (еХ4егпа! Ѕиђ- 
гоийпе), написанных на С или С++. 


Х5ОВ 


Внешняя подпрограмма, определенная на 
языке ХБ. 


уасс 


Үеі Апо ег СошрНег Сотр!Иег — еще один 
компилятор компиляторов. Генератор ана- 
лизаторов, без которого существование Регі 
было бы, вероятно, невозможно. См. файл 
регіу.у в дистрибутиве исходного кода Рег]. 


автозагрузка — ашооа@ 


Загрузка по мере необходимости. (Также 
называется «отложенной» или «ленивой» 
загрузкой.) Конкретно: вызов подпрограм- 
мы АЏТОЃОАО в интересах подпрограммы, 
которая не определена. 


автоинкрементирование — 
ашошсгетепй 


Автоматическое прибавление единицы 
к существующему значению; отсюда ведет 
свое название оператор ++, Если же едини- 
ца автоматически вычитается, это называ- 
ется «автодекрементированием». 
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автоматическая генерация - 
ашорепега оп 


Возможность перегрузки операторов объ- 
ектов, при которой поведение некоторых 
операторов можно предсказать, основыва- 
ясь на более фундаментальных операто- 
рах. При этом предполагается, что пере- 
груженные операторы часто имеют такие 
жесвязи между собой, как обычные опера- 
торы. См. главу 18. 


автоматическое расщепление — 
апіоѕріі 


Автоматическое расщепление строки, как 
егоосуществляет ключ (зийсй) -а при запус- 
кес -р или -п для эмуляции аш. (См. также 
модуль Аџї05р11+, который никак не связан 
с ключом -а, но весьма тесно связан с авто- 
загрузкой.) 


алгоритм — ајеогіёһт 
Четко определенная последовательность 


шагов, описанная достаточно ясно, чтобы 
их мог выполнить даже компьютер. 


алфавитный — аірһађейс 


Тип символов, из которых мы составляем 
слова. В Юникоде это все буквы, включая 
все идеографические знаки и некоторые 
диакритические знаки, буквы-цифры, та- 
кие как римские цифры, и различные ком- 
бинационные знаки. 


альтернативы — аЌегпаііуеѕ 


Список возможных вариантов, из которых 
можно ныбрать только один, как в этом во- 
просе: «В какую дверь вы хотите войти – А, 
В или С?» Альтернативы в регулярных вы- 
ражениях разделяются одиночной верти- 
кальной чертой: |. Альтернативы в обыч- 
ных выражениях Рег! разделяются двой- 
ной вертикальной чертой: ||. Логические 
альтернативы в булевых выражениях раз- 
деляются оператором || или ог. 


анонимный — апопушоиѕ 

Используется для описания объекта ссыл- 
ки, который не доступен непосредствен- 
но через именованную переменную. Такой 


эв1 


объект ссылки должен быть косвенно дос- 
тупен по крайней мере через одну жесткую 
ссылку. При исчезновении последней жест- 
кой ссылки анонимный объект безжалост- 
но уничтожается. 


аргумент — аггитеп 

Некоторые данные, передаваемые програм 
ме, подпрограмме, функции или методу, 
и указывающие, что следует сделать. Ар- 
гумент также называют «параметром». 


аргументы командной строки — 
соттапа-іпе агситепіѕ 


Значения, передаваемые вместе с именем 
программы, когда необходимо указать ин 
терпретатору команд, что он должеЕ вы" 
полнить команду. Эти значения передают- 
ся программе Рей через @АВС\. 


арифметический оператор — 
аг | тейса! орегафог 


Символ, такой как + или /, указывающий 
Рег на необходимость выполнения ариф- 
метических действий, которые вы должны 
были изучить в начальной школе. 


Артистическая Лицензия — 
Агизис Ілсепѕе! 


Открытая лицензия, созданная Ларри 
Уоллом (Гаггу Ма) для Реп, чтобы мак- 
симально повысить практическую поль- 
зу Рей, его доступность и изменчивость. 
Текущей является версия 2.0 (ВНр://шило. 
орепзоитсе.огЕ/Исепзез/агизис-Исепзе.рйр). 


архитектура — агсһіќесіџге 


Тип компьютера, на котором вы работаете, 
где «тип» означает, что все такие компь- 
ютеры используют совместимый машин- 
ный язык. Поскольку программы на Рег] 
(обычно) являются простыми текстовыми 
файлами, а не исполняемыми образами, 
программа на Регі значительно менее чув- 
ствительна к архитектуре платформы ис- 
полнения, чем другие языки (например, 
С), которые компилируются в машинный 
код. См. также платформа и операцион- 
ная система. 


1 Словосочетание «агііѕііс ісепѕе» также переводится как «поэтическая вольность». — Прим. 


ред. 
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асинхронный — азупейгопойи$ 


Касается событий или действий, относи- 
тельный порядок которых во времени не 
детерминирован, так как слишком многое 
происходит одновременно. Поэтому асин- 
хронным называют событие, о котором не- 
известно, когда его следует ожидать. 


ассоциативность — аѕѕосіаііуіќу 


Определяет, какой оператор следует вы- 
полнить сначала – левый или правый, ес- 
ли дано выражение «А оператор В опера- 
тор С» и оба оператора имеют одинаковый 
приоритет. Операторы типа + являются 
ассоциативными слева, а операторы типа 
„х – ассоциативными справа. См. в главе 3 
список операторов с указанием их ассо- 
циативности. 


ассоциативный массив — 
аѕѕосіаііуе аггау 


См. хеш. Термин «ассоциативный массив» 
использовался для обозначения хешей 
в Рег 4. В некоторых языках хеши назы- 
ваются словарями. 


атом — аот 


Компонент регулярного выражения, ко- 
торый может соответствовать подстроке, 
содержащей один или более символов, 
и рассматриваемый как неделимая син- 
таксическая единица любыми последую- 
щими квантификаторами. (В противопо- 
ложность утверждению, соответствующе- 
му чему-то, что имеет нулевую ширину и не 
может быть квантифицировано.) 


атомарная операция — аіошіс орегай оп 
Когда Демокрит назвал словом «атом» не- 
делимые частицы материи, он буквально 
имел в виду нечто, что нельзя разрезать: 
а- (не) + -торос (делимое). Атомарная опе- 
рация — это действие, которое нельзя пре- 
рвать, а не действие, запрещенное в безъ- 
ядерной зоне. 


атомарный квантификатор — роѕѕеѕѕіуе 


Так называются квантификаторы и груп- 
пы в шаблонах, которые не отдают то, что 
им удалось заполучить. Более простой и по- 
нятный термин, чем «не допускающий воз- 
врата». 


атрибут — абеЬше 


Новая возможность, позволяющая объяв- 
лять переменные и подпрограммы с моди- 
фикаторами, например ѕир Гоо 1оскед 
пеїһоа. Кроме того, используется как дру- 
гос название для переменной экземпляра 
объекта. 


базовый класс — Базе сІаѕѕ 


Обобщенный тип обзекта; означает класс, 
от которого путем наследования генети- 
чески производятся другие, более специа- 
лизированные классы. Уважающие своих 
предков используют так же обозначение 
«надкласс» или «суперкласс». 


байт — Бе 
Фрагмент данных из восьми битов. 


байт-код — Буѓесойе 

Гибридный язык, на котором разговарива- 
ют андроиды, когда не хотят раскрывать 
свою ориентацию (см. порядок следования 
байтов). Получил название от аналогич- 
ных языков, на которых (по тем же причи: 
нам) общались между собой интерпретато- 
ры и компиляторы в конце ХХ века. Эти 
языки отличаются тем, что представляют 
все как последовательность байтов, не за 
висящую от архитектуры. 


бесплатно доступное — ѓгееіу ауаЦаЫе 


Означает, что за это не надо платить, но ав: 
торские права на это могут принадлежать 
кому-нибудь другому (например, Ларри). 


бесплатно распространяемое — 
ҒгееІу гедіѕігіђиќаЫе 


Означает, что у вас не будет неприятностей 
с законом, если вы сделаете копию и дади: 
те своих друзьям, а мы об этом узнаем. На 
самом деле мы бы хотели, чтобы вы разда- 
ли копии всем своим друзьям. 


бесплатное программное обеспечение — 
Ғтеемаге 


Традиционно — любое программное обес- 
печение, которое отдают даром, особенно 
если при этом делают доступным также 
исходный код. Теперь это часто называют 
программным обеспечением с открытым 
исходным кодом (ореп зоигсе зофноаге). Од- 
но время была тенденция использовать 
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термин ѓгеешаге ь противовес термину ореп 
зоигсе зо] поаге, подчеркивая бесплатность 
программного обеспечения, выпускаемого 
под универсальной общественной лицен- 
зией Фонда свободно распространяемого 
программного обеспечения (Егее ЗоЁл\маге 
Еоппдайоп Сепега] РоЫіс Іісепѕе — СРП), 
но это трудно оправдать этимологически. 


библиотека — ИБгагу 


Обычно — собрание процедур. В прежние 
времена термин обозначал собрание про- 
цедур в файле .рі. В наше время чаще от- 
носится ко всей совокупности модулей Ре] 
в системе. 


бинарный — Ыпагу 
См. двоичный. 


бинарный оператор — һірагу орегаќог 
Оператор, принимающий два операнда. 


бит — ЫЕ 

Целое число в диапазоне от 0 до 1 включи- 
чельно. Наименьшая возможная единица 
хранения информации. Одна восьмая часть 
байта или доллара. (Название старого ис- 
панского доллара «ріесе оѓ еіс», т.е. «из 
восьми частей», происходит от того, что 
можно было разделить его на восемь частей, 
каждая из которых по-прежнему считалась 
деньгами. Поэтому для 25-центовой монеты 
и сегодня сохранилось название «уо Ы&з».) 


бит выполнения — ехесше Бі 


Специальная метка, сообщающая операци- 
онной системе, что ту или иную программу 
можно выполнить. На самом деле, в ОМТХ 
есть три бита выполнения, а который из 
них используется, зависит от того, владее- 
те ли вы файлом единолично, коллективно 
или не владеете вообще. 


битовая строка — Ш ѕігіпе 


(Битовый вектор.) Последовательность би- 
тов, которая в данном случае действитель- 
но рассматривается как последователь- 
ность битов. 


биты разрешений — регіпіѕѕіоп 615 

Биты, которые устанавливает или сбра- 
сывает владелец файла, чтобы разрешить 
или запретить доступ к нему других поль- 
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зователей. Эти биты флагов являются ча- 
стью режима, возвращаемого встроенной 
функцией 51а по запросу информации 
о файле. В системах ПЈМ№МІХ можно полу- 
чить дополнительные сведения на страни- 
це руководства 15(1). 


блок, блокирование — Моск 

То, что делает процесс, когда ему прихо- 
дится чего-то ждать: «Мой процесс был за- 
блокирован вожидании диска». Выполняя 
функцию существительного из другой опе- 
ры, озвачает фрагмент данных, имеющий 
размер, выбранный операционной систе 
мой (обычно степень двух, например 512 
или 8192). Как правило, речь о данных, 
поступивших из дискового файла или за- 
писываемых в него. 


блок, в хешах — БисКкеё 

Область хеш-таблицы, состоящая (потен- 
циально) из многих записей, ключи кото- 
рых «хешируются» в одно и то же значение 
ь результате применения хеш-функции. 
(Это внутренняя политика, которая не 
должна вас беспокоить, если только вас не 
интересуют внутренности или политика.) 


блочная буферизация — Моск Ьџќѓегіпе 


Способ повышения эффективности ввода/ 
вывода путем передачи сразу целого бло- 
ка. По умолчанию Ре! осуществляет по- 
блочную буферизацию дисковых файлов. 
См. буфер и буферизация команд. 


булев контекст — Воеап сопіехі 


Особого рода скалярный контекст, ис- 
пользуемый в условных операторах для 
определения истинности (или ложности) 
скалярного значения, возвращаемого вы- 
ражением. Не вычисляется как строка или 
число. См. контекст. 


булево значение — Вооіеап 


Значение, которое является истиной (гие) 
или ложью (#а1зе). 


буфер — Бег 


Область для временного хранения данных. 
Блочная буферизация означает, что дан- 
ные передаются в место своего назначения, 
когда буфер оказывается заполненным 
Строковая буферизация означает, что они 
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передаются, когда получена законченная 
строка. Буферизация команд означает, что 
данные передаются при выполнении ко- 
манды ргіпї (или эквивалентной ей). Если 
вывод не буферизован, система обрабаты- 
вает байты по одному, не используя про- 
межуточную область хранения. Это может 
оказаться весьма неэффективным. 


буферизация команд — 
соштапа Бийегте 


Механизм, позволяющий накапливать вы- 
вод каждой команды Рег], а затем вытал- 
кивать все сразу единственным обраще- 
нием к операционной системе. Он вклю- 
чается путем установки переменной $| 
(ФАОТОРЦИЗН) в истинное значение. Исполь- 
зуется, когда нежелательно, чтобы данные 
задерживались и не отправлялись туда, 
куда положено, что может происходить, 
так как по умолчанию для файлов и кана- 
лов используется блочная буферизация. 


буферизация строковая -- іпе БоЙете 


Используется выходным потоком стан- 
дартного ввода/вывода, который вытал- 
кивает свой буфер после каждого символа 
перевода строки. Многие библиотеки стан- 
дартного ввода/вывода автоматически ус- 
танавливают строковую буферизацию при 
выводе в терминал. 


вариадический — уагіайіс 

Относится к функции, способной прини- 
мать неопределенное число фактических 
аргументов. 


вектор — уесіог 


Математический жаргонный термин, обо- 
значающий список скалярных значений. 


верхний регистр — иррегсаѕе 


В Юникоде к верхнему регистру относятся 
не только символы из категории Оррегсазе 
Гейег, но и любые символы со свойством 
Оррегсаѕе, включая Геіќег Митђегѕ и Зут- 
Ъо]з. Не путайте с заглавным регистром. 


ветвление — югК 


Порождает процесс, идентичный роди- 
тельскому на момент зачатия, но пока не 


получивший собственные мысли. Поток 
({һгеаад) с защищенной памятью. 


взломщик — сгасКег 


Некто, взламывающий систему безопасно- 
сти в компьютерных системах. Взломщик 
может быть настоящим хакером или про- 
сто зе" рЕ Кіааіе. 


виртуальный — уфиа| 


Создающий видимость чего-либо, что не су- 
ществует в реальности, кик, например, это 
делает виртуальная память, не являющая- 
ся памятью в действительности. (См. также 
память.) Противоположностью «виртуаль- 
ного» является «прозрачное» (4гапзрагеп\), 
что означает реальное существование чего- 
либо без внешнего проявления; например, 
прозрачная обработка Рег! строк перемен- 
ной длины в кодировке символов ОТЕ-8. 


висячая команда — дапеИие ѕќаіетепё 


Отдельная голая команда, без каких-либо 
скобок, «свисающая» с условного операто- 
ра Ш или мћі1е. Язык С разрешает их ис- 
пользование. Регі - нет. 


владелец — оупег 
Единственный пользователь (помимо су- 
перпользователя), имеющий абсолютный 
контроль над файлом. У файла может су- 
ществовать группа пользователей, совме- 
стно владеющих файлом, если это разре- 
шено фактическим владельцем. См. биты 
разрешений. 


внедренные документы — Веге йосшпепіѕ 


Названы так по аналогии с эквивалент- 
ной конструкцией в интерпретаторах ко- 
манд, которая делает вид, что строки, сле- 
дующие за командой, являются отдельным 
файлом, который нужно подать на вход ко- 
манды, вплоть до некоторой завершающей 
строки. Однако в Рей это просто причудли- 
вый способ заключить строку в кавычки. 


возвращаемое значение — гефигп уаше 


Значение, которое создает подпрограмма 
или выражение при вычислении. В Ре 
возвращаемое значение может быть спи- 
ском или скаляром. 
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волшебное инкрементирование — 
тасіса1 іпсгетепі 


Оператор инкрементирования, который 
умеет наращивать буквы так же, как 
и цифры. 


волшебные переменные — 
таріса] уагіаЫеѕ 


Специальные переменные с побочными 
эффектами, проявляющимися при обра- 
щении к ним или присваивании. Напри- 
мер, в Рег! изменение элементов массива 
ЖЕМ изменяет соответствующие перемен- 
ные среды, которые будут использоваться 
подпроцессами. Чтение переменной $! дает 
номер текущей системной ошибки или со- 
общение для нее. 


волшебство, магия — тар1с 

Технически говоря, любая дополнитель- 
ная семантика, прикрепленная к перемен- 
ным, таким как $!, $0, ЕМУ или %516, либо 
к любой связанной переменной. Волшеб- 
ство происходит, когда вы модифицируете 
(не слишком аккуратно) эти переменные. 


восьмеричный — осѓа1 


Число по основанию 8. Допустимы только 
цифры от 0 до 7. Восьмеричные константы 
начинаются в Ре! нулем, как, например 
в случае 013. См. также функцию осї. 


временная память — ѕсгаќсһрай 


Область, в которой конкретный вызов кон- 
кретного файла или подпрограммы хра- 
нит некоторые свои временные значения, 
включая переменные с лексической обла- 
стью видимости. 


встраивание — епђеййіпе 

Когда одно содержится в другом, особенно 
если это необычно: «Я встроил полный ин- 
терпретатор Ре в свой редактор!» 


встроенная функция — Бшіё-іп 

Функция, которая предопределена в языке. 
Даже если она скрыта в результате перена- 
значения, вы всегда можете вызвать встро- 
енную функции, если квалифицируете 
имя такой функции псевдопакетом СОВЕ::. 
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вызов — туосайоп 


Действие, направленное на вызов божества, 
демона, программы, метода, подпрограм- 
мы или функции, имеющее целью заста- 
вить их делать то, что, по вашему мнению, 
они должны делать. Обычно «саП» отно- 
сится к подпрограммам, а «1пуоке» — к ме- 
тодам, поскольку это звучит более модно. 


вызов по значению — са] Бу уаше 


Механизм передачи аргументов, при ко- 
тором формальные аргументы ссылаются 
на копии фактических аргументов, и под- 
программа не может изменить фактиче- 
ские аргументы, изменяя формальные. 
См. также вызов по ссылке. 


вызов по ссылке — са! бу геѓегепсе 


Механизм передачи аргументов, при ко- 
тором формальные аргументы нєпосредст- 
венно ссылаются на фактические аргумен- 
ты, и подпрогримма может изменять фак- 
тические аргументы, изменяя формальные. 
Это означает, что формальный аргумент 
представляет собой псевдоним фактическо- 
го аргумента. См. также вызов по значению. 


вызывающий — іпуосапі 


Агент, от имени которого вызывается ме- 
тод. Для метода класса вызывающим (ин- 
вокантом) является имя пакета. Для ме- 
тода экземпляра вызывающей является 
ссылка на объект. 


выполнить — ехесиќе 


Запустить текущую программу или под- 
программу. (Не имеет отношения к встро- 
енной функции К111, если только вы не пы- 
таетесь запустить обработчик сигнала.) 


выражение — ехргеѕѕіоп 


Все, что допускается сказать там, где требу- 
ется значение. Обычно составляется и? ли- 
тералов, переменных, операторов, функ- 
ций и вызовов подпрограмм, не обязатель- 
но в указанном порядке. 


высокомерие — һиђгіѕ 

Чрезмерная гордость — из разряда вещей, 
за которые Зевс мечет в нас свои молнии. 
Также качество, заставляющее нас писать 
(и сопровождать) такие программы, о кото- 
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рых другие не смогут сказать ничего худо- 
гс. Посему является третьей великой доб- 
родетелью программиста. См. также лень 
и нетерпеливость. 


генератор кода -- соде гепегайог 

Система, которая пишет для вас код на 
языке низкого уровня, например, код, реа- 
лизующий сервер компилятора. См. гене- 
ратор программ. 


генератор программ — 
рговгат репегафог 

Система, алгоритмически создающая для 
пользователя код на языке высокого уров- 
ня. См. также генератор кода. 


главный хранитель — 
ргітағгу шайцатег 


Автор, зарегистрированный на сервере 
РАПОБЗЕ, обладающий правом выдавать 
привилегии со-хранителя пространства 
имен. Главный хранитель может передать 
свои привилегии другому автору, зареги- 
стрированному на РАОБЕ. См. главу 19. 


глобальное разрушение — 
Лођа] деѕігисііоп 


Уборка мусора для глобальных элементов 
(и выполнение деструкторов всех вовле- 
ченных объектов), козоран происходит по 
завершении работы интерпретатора Регі. 
Глобальное разрушение не следует путать 
с Апокалипсисом, исключая тот случай, 
когда они совпадают. 


глобальный — р1оБа| 


Нечто, что видно отовсюду; обычно исполь- 
зуется в отношении переменных и под- 
программ, которые видны в любом месте 
программы. В Ре подлинно глобальные 
переменные можно сосчитать на пальцах — 
большинство переменных (и все подпро- 
граммы) существует только в текущем по- 
кете. Глобальные переменные могут объ- 
являться с помощью оиг. См. раздел «Гло- 
бальные объявления» главы 4. 


голое (простое) слово — Багеугога 


Слово достаточно неоднозначное, чтобы 
рассматриваться как незаконное, если дей- 
ствует директива изе ѕігісі 'ѕи0ѕ'. В отсут- 
ствие такого ограничения голое слово рас- 
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сматривается, как если бы оно было заклю- 
чено в кавычки. 


графема – ргарһете 

Графен – двумерная аллотропная моди- 
фикация углерода, образованная слоем 
атомов углерода толщиной в один атом, со- 
единенных в гексагональную двумерную 
кристаллическую решетку. Графема, бо- 
лее полное название «кластер графемы» — 
единый символ, видимый пользователем, 
который в свою очередь может состоять из 
нескольких символов (кодов). Например, 
возврат каретки и перевод строки образу- 
ют единственную графему, состоящую из 
двух символов, а 0» — единственная гра- 
фема, но состонщая из одного, двух или 
даже трех символов, в зависимости от нор- 
мализации. 


группа — вгопр 

Множество пользователей, которому вы 
принадлежите. В некоторых операцион- 
ных системах (например, ОМІХ) вы можете 
давать определенные права доступа к фай: 
лам остальным членам своей группы. 


дамп памяти — соге дитр 


Тело процесса в виде файла, сохраненного 
в рабочем каталоге процесса, обычно как 
результат некоторых видов фатальных 
ошибок. 


данные экземпляра — іпѕіапсе даа 
См. переменная экземпляра. 


датаграмма — даќаргат 

Пакет данных, например сообщение ОШР, 
которое (с точки зрения участвующих про- 
грамм) может независимо пересылаться по 
сети. (На самом деле, все пакеты посыла- 
ются независимо на уровне ІР, но поточ- 
ные протоколы вроде ТСР скрывают это от 
вашей программы.) 


двоичный — Ьіпагу 


Относящийся к числам по основанию 2. 
Это означает, что, по существу, есть два 
числа, 0 и 1. Употребляется также для 
описания «нетекстового» файла, возмож- 
но, потому, что такой файл использует все 
двоичные разряды своих байтов. С прихо- 
дом Юникода такое различие, уже изна- 
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чально подозрительное, еще более утрачи- 
вает свое значение. 


двойная жизнь — 4иа1-ПуеЯ 

Некоторые модули распространяются од- 
новременно и в «оставе стандартной биб- 
лиотеки, и через СРАМ. Развитие этих мо- 
дулей может идти двумя путями, так как 
дорабатываться может любая из двух вер- 
сий. В настоящее время стоит вопрос о том. 
как упорядочить подобные ситуации. 


декрементирование — йесгетепё 


Вычитание значения из переменной, на- 
пример, «декрементировать $х» (что оз- 
начает вычесть 1 из значения) или «декре- 
ментировать фх на 3». 


дерево синтаксического анализа — 
рагѕе ігее 


См. синтаксическое дерево. 


дескриптор каталога — бігесіогу һапдіе 


Имя, представляющее конкретный откры- 
тый для чтения каталог — вплоть до его за- 
крытия. См. функцию орепо1г. 


дескриптор файла -- ерап Ме 


Идентификатор (не обязательно связан- 
ный с действительным именем файла), 
представляющий конкретный открытый 
файл до тех пор, пока не будет закрыт. Ес- 
ли предполагается открывать и закрывать 
несколько разных файлов подряд, удобно 
открывать их все через один и тот же деск- 
риптор файла, а не писать отдельный код 
для обработки каждого файла. 


деструктор — йеѕігисёог 


Особый метод, вызываемый, когда объект 
собирается разрушить себя. Метод ОЕЅТВОҮ 
ничего фактически не разрушает; Ре] 
просто запускает этот метод, когда класс 
нуждается в какой-нибудь чистке, связан- 
ной с разрушением. 


динамическая область видимости — 
дупатіс сорте 

Динамическая область видимости делает 
переменные видимыми во всей оставшейся 
части блока, в котором они впервые исполь- 
зованы, и в любых лодпрограммах, вызы- 
ваемых оставшейся частью блока. Значе- 
ния переменных с динамической областью 
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видимости могут временно изменяться 
(и неявно восстанавливаться позже) с помо- 
щью оператора 1оса1. (Сравните с лексиче 
ской областью видимости.) Более вольная 
трактовка обозначает, что подпрограмма 
в процессе вызова другой подпрограммы 
«содержит» эту последнюю на этапе вылол 
нения. 


директива — дігесііуе 
Директива род. См. главу 28. 


дистрибутив — діѕігібиёіоп 

Стандартный укомплектованный выпуск 
системы программного обеспечения. Обыч- 
ное использование предполагает наличие 
исходного текста. Если это не так, дистри- 
бутив называется двоичным (Ыпагу-оту). 


дисциплина — діѕсіріпе 

Некоторым она необходима, а некоторые 
ее избегают. В Рег! – это прежнее название 
фильтров ввода/вывода (1/0 ]ауег). 


домашний каталог — ћҺоте дігесіогу 


Каталог, в который система переносит 
пользователя после регистрации. В сис- 
темах ОМІХ его имя часто помещается 
в ФЕМАНОМЕ} или $ЕМ№106019} при регист- 
рации, но можно найти его и посредством 
(9еірми10($<))17]. (Некоторые платформы 
не имеют понятия домашнего каталога.) 


доступа, методы — ассеѕѕог теіһойѕ 


Методы, предназначеные для косвенного 
просмотра или обновления состояния объ- 
екта (его переменных экземпляра). 


единица компиляции — сошрЦайоп ипіё 


Файл (или строка в случае е\уа1), компили- 
руемый в данный момент. 


жадный — этееду 


Подшаблон, квантификатор которого хо- 
чет найти как можно больше. 


жесткая ссылка — һагӣ геѓегепсе 


Скалярная величина, содержащая фак- 
тический адрес объекта ссылки, которая 
учитывается счетчиком ссылок объекта 
ссылки. (Некоторые жесткие ссылки хра- 
нятся внутренне, например неявная ссыл- 
ка в одной из позиций переменной #уре об 
на соответствующий объект ссылки.) Же- 
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сткая ссылка отличается от символической 
ссылки. 


заглавный регистр — ИНесазе 


Регистр прописных символов, за которыми 
следуют строчные символы, а не символы 
верхнего регистра. Иногда называют реги- 
стром предложения. В английском алфа- 
вите не используется заглавный регистр 
Юникода, но правила оформления реги- 
стра символов в названиях на английском 
языке гораздо сложнее, чем простое приве- 
дение к верхнему регистру первых симво- 
лов всех слов. 


заголовочный файл — һеадег Ше 


Файл, содержащий некие определения, 
которые необходимо включить «во главе» 
своей программы, чтобы произвести неко- 
торые скрытые операции. Заголовочный 
файл С имеет расширение .Р. Рей, по прав- 
де говоря, не имеет заголовочных файлов, 
хотя традиционно иногда использовал от- 
транслированные файлы . с расширением 
‚р. См. гедиіге в главе 27. (Заголовочные 
файлы заменены механизмом модулей.) 


замещение — оуегг те 


Сокрытие или отключение некоторого дру- 
гого определения с тем же именем. (Не пу- 
тать с перегрузкой, которая добавляет опре- 
деления, двусмысленность которых долж- 
на быть разрешена каким-то другим спосо- 
бом.) Чтобы еще сильнее запутать вопрос, 
мы используем слово с двумя перегружен- 
ными определениями: для описания того, 
как можно определить собственную под- 
программу и скрыть встроенную функцию 
с таким же именем (см. раздел «Замещение 
встроенных функций» главы 11), и для опи- 
сания того, как можно определить в произ- 
водном классе замещающий метод, чтобы 
скрыть метод базового класса с тем же име- 
нем (см. главу 12). 


замыкание — сіоѕиге 


Анонимная подпрограмма, которая, при 
создании ссылки на нее на этапе выпол- 
нения, продолжает отслеживать видимые 
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извне лексические переменные даже по- 
сле того, как эти лексические переменные 
должны были выйти из области видимо- 
сти. Название «замыкание» вызвано тем, 
что подобное поведение анонимных функ- 
ций дает математикам ощущение прият- 
ного замыкания!. 


запись — гесога 


Набор взаимосвязанных значений в фай- 
ле или потоке, часто ассоциированных 
с уникальным полем ключа. В ОМІХ обыч- 
но соответствует строке или группе строк, 
оканчивающейся пустой строкой (иначе 
говоря, абзацу»). Каждая строка файла 
/еіс/равѕша представляет собой запись со 
сведениями о пользователе, ключом кото- 
рой служит имя пользователн. 


зарезервированные слова — 
геѕегуей уогіѕ 


Слова имеющие особое значение для ком 
пилятора, например іѓ или еіеїе. Во мно- 
гих языках (но не в Рен) не допускается 
употребление зарезервированных слов для 
других целей. (В конце концов, потому они 
и зарезервированы.) В Рег нельзя исполь- 
зовать их только в метках и дескрипто- 
рах файлов. Также называются «ключе- 
выми словами». 


захват — сарбагте 


Применение круглых скобок для выделе- 
ния подшаблонов в регулярных выраже- 
ниях с целью сохранить найденную под: 
строку как ссылку на найденный текст 
(БасЕгеўегепсе). (Захваченные строки воз- 
вращаются в виде списка в списочном кон: 
тексте.) См. главу 5. 


зернистость — ргапагНу 


Говоря абстрактно, размер фрагментов, 
с которыми вы работаете. 


значение — уаше 


Фактические данные, в отличие от пере- 
менных, ссылок, ключей, индексов, опера- 
торов и всего прочего, что нужно для дос- 
тупа к значению. 


1 Слово созиге в английском языке имеет много значений, в том числе: облегчение, исцеле- 


ние, катарсис. – Прим. ред. 
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значение по умолчанию — деёаи 


Значение, которое используется, если не 
задано никакое иное 


зомби — хошШе 

Умерший (завершившийся) процесс, ро- 
дители которого не получили надлежаще- 
го извещения о его кончине посредством 
вызова маії или ма р19. При выполнении 
ветвления ѓогк следует прибирать за свои- 
ми порожденными процессами после их 
завершения, иначе таблица процессов пе- 
реполнится и ваш системный администра- 
тор будет вами недоволен. 


идентификатор — ійепіібег 
Сформированное в соответствии с правила- 
ми имя, применяемое почти для всего, что 
может интересовать компьютерную про- 
грамму. Многие языки (в том числе Рет]) до- 
пускают идентификаторы, которые начи- 
наются буквой и содержат буквы и цифры. 
Рег считает символ подчеркивания бук- 
вой. (В Рег есть также более сложные име- 
на, например квалифицированные имена.) 


именованный канал — патей ріре 


Канал, имеющий имя на уровне файловой 
системы, к которому могут иметь доступ 
два несвязанных процесса. 


импорт, импортировать — ітрогі 
Получить доступ к символам, экспортируе- 
мым другим модулем. См. иѕе в главе 27. 


имя команды — соттапаӣ пате 

Имя программы, выполняемой в данный 
момент, как оно было набрано в командной 
строке. В языке С имя команды передается 
как первый аргумент командной строки. 
В Рей] оно содержится в переменной $0. 


имя файла — Шепаше 

Это имя находится в каталоге и может 
использоваться функцией ореп, когда мы 
сообщаем операционной системе, какой 
именно файл собираемся открыть, чтобы 
связать файл с дескриптором файла, кото- 
рый и будет представлять этот файл в на- 
шей программе, пока мы не закроем его. 
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индекс — ѕибѕегірі 


Значение, указывающее на позицию кон- 
кретного элемента в массиве. 


индексация — іпдехіпе 

В прежние времена сос:гояла в поиске клю 
ча в настоящем справочнике (например, 
телефонной книге), но сейчас это просхго 
применение любого ключа или позиции 
для поиска соответствующего зничения, 
даже если никакого индекса (указателя) не 
существует. Дело дошло до того, что функ- 
ция іпдех в Рег просто находит позицию 
(индекс) одной строки в другой. 


инкапсуляция — епсарзШайоп 


Завеса абстракции, отделяющая интер- 
фейс от реализации и требующая, чтобы 
любой доступ к состоянию объекта осуще- 
ствлялся только через методы. 


инкрементирование — іпсгетепі 


Увеличение какого-либо значения на 1 (или 
другое число, если оно указано). 


инструкция — ѕіаіетепі 


Инструкция, сообщающая компьютеру, 
что делать дальше, как инструкция в ре- 
цепте: «Добавить мармелад в тесто и пере- 
мешивать, пока не перемешается». Инст- 
рукция отличается от объявления, которое 
предписывает компьютеру не сделать что: 
либо, а узнать что-либо. 


инструкция управления циклом — 
1оор сопёг`о1 ѕќаќетепё 


Любая инструкция в теле цикла, которая 
может досрочно завершить цикл или про- 
пустить итерацию. Как правило, лучше 
не пробовать выполнить это на американ- 
ских горках. 


интерполяция — іпіегроіаііоп 


Вставка скалярного или списочного значе- 
ния в середину другого значения так, будто 
оно было там всегда. В Рей интерполяция 
переменных осуществляется в двойных ка- 
вычках и шаблонах, а интерполяция спи- 
сков происходит при создании списка зна- 
чений для передачи списочному оператору 
или другой конструкции, принимающей 
список. 
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интерполяция переменных — 
уагіаЫе іпіегроіаійіоп 


Интерполяция переменной скаляра или 
массива в строку. 


интерпретатор — іпіегргеїіег 


Строго говоря, это программа, которая чи- 
тает вторую программу и делает то, что эта 
вторая программа говорит, непосредствен- 
но, не преобразуя сначала эту программу 
в другую форму (чем занимаются компи- 
ляторы). Рей не является интерпретато- 
ром согласно этому определению, посколь- 
ку содержит некий компилятор, который 
преобразует программу в более пригодную 
для выполнения форму (синтаксические 
деревья) внутри самого процесса рей, кото- 
рую затем интерпретирует система этапа 
выполнения Рей. 


интерпретатор команд — зНе] 
Интерпретатор командной строки. Про- 
грамма, которая выдает интерактивное 
приглашение, принимает одну или не- 
сколько строчек ввода и выполняет ука- 
занные программы, передавая каждой из 
них надлежащие аргументы и входные 
данные. Интерпретаторы команд способ- 
ны также выполнять сценарии, состоящие 
из таких команд. Распространенные ин- 
терпретаторы команд ОМІХ: интерпрета- 
тор Борна (/Ып/5й), интерпретатор С (/Біп/ 
с5й), а также интерпретатор Корна (/біп/ 
$1). Строго говоря, Ре] интерпретатором 
команд не является, поскольку не инте- 
рактивен (хотя программы, написанные 
на Рег, могут быть интерактивными). 


интерфейс — іпіегѓасе 


Услуги, которые некий код обещает пре- 
доставлять всегда, в отличие от реализа 
ции, которую он может изменить, когда 
того пожелает. 


инфиксный оператор — шй‚х 
Оператор, который располагается между 


своими операндами, например умножение: 
24 * 7. 


исключение — ехсерііоп 


Причудливый термин, обозначающий 
ошибку. См. фатальная ошибка. 
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исполняемый файл — ехесиіаЫе е 


Файл, помеченный особым образом, го- 
ворящим операционной системе, что его 
можно выполнять как программу. 


истина — фгие 


Любое скалярное значение, отличное от 0 
или “". 


итератор — ќегаќог 

Специальная программная штуковина, ко- 
торая следит за тем, в каком месте того, что 
вы пытаетесь обойти, вы находитесь. Цикл 
Гогеасн в Рег содержит итератор, как и хеш, 
что позволяет применить к нему еасћ. 


итерация — Негацоп 
Многократное выполнение чего-либо. 


канал — ріре 

Прямое соединение, которое подает вывод 
одного процесса на ввод другого без приме- 
нения промежуточного временного файла. 
Когда канал установлен, соответствующие 
два процесса могут осуществлять чтение 
и запись, как в обычный файл, с некото- 
рыми ограничениями. 


канонический — сапошса] 


Приведенный к стандартной форме для об- 
легчения сравнения. 


каталог — ігесіогу 

Особый файл, содержащий другие файлы. 
В некоторых операционных системах та- 
кие файлы могут называться «папками», 
«ящиками» ит.д. 


квалифицированный — диа Ѓіеа 

С указанием полного имени. Символ $Епї:: 
м00{ квалифицирован; $поої не квалифи- 
цирован. Полностью квалифицированное 
имя задается от каталога верхнего уровня. 


квантификатор — диапыйЙег 


Компонент регулярного выражения, указы- 
вающий число повторений предшествую- 
шего атома. 


класс — <1а85 


Определенный пользователем тип, реа- 
лизованный в Ре! через пакет, который 
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предоставляет (непосредственно или в ре- 
зультате наследования) методы (т.е. под- 
программы) для работы с экземплярами 
класса (его объектами). См. также наследо- 
вание. 


класс символов — сВагасфег с1аѕѕ 


Список символов, заключенный в квадрат- 
ные скобки и указываклций в регулярных 
выражениях, что любой символ из данного 
набора может находиться в данном месте. 
Более широко — любой предопределенный 
набор символов, используемый таким об- 
разом. 


кластер — сіиѕіег 


Заключенный в круглые скобки подшаб- 
лон, используемый для объединения час- 
тей регулярного выражения в елиный атом. 


кластер ключей — ѕуіёсһ сшфег 


Объединение нескольких ключей команд- 
ной строки (например, -а -6 -с) в один 
ключ (т.е. -абс). Любой ключ с дополни- 
тельным аргументом должен быть послед- 
ним в кластере. 


клиент — сНепё 


В сегевом взаимодействии — процесс, ини- 
циирующий контакт с процессом сервера, 
чтобы обменяться данными и, возможно, 
получить обслуживание. 


ключ — Кеу 


Строковый индекс хеша, используемый 
для поиска значения, связанного с этим 
ключом. 


ключ — змс Ь 


Параметр, передаваемый в командной стро- 
ке с целью повлиять на ход выполнения 
программы, и обычно предваряемый зна- 
ком «минус». Слово может также исполь- 
зоваться как кличка для переключателя. 


ключевое слово — Кеууога 
См. зарезервированные слова. 


код символа — сойероіпі 


Целое число, используемое компьютером 
для представления данного символа. Коды 
АЗСП-символов находятся в диапазоне от 
О до 127; коды символов Юникода находят- 
ся в диапазоне от 0 до Ох1Е_ЕЕЕЕ; а коды 
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символов, поддерживаемые языком Рег], — 
в диапазоне от 0 до 222—1 или от 0 до 2641 
в зависимости от размерности целых чи- 
сел на конкретной архитектуре. В культу- 
ре Рен их иногда называют порядковыми 
значениями. 


команда — соттапа 


В языке интерпретатора команд означает 
синтаксическое сочетание имени програм- 
мы с ее аргументами. В более широком 
смысле – любые данные, введенные в ин- 
черпретатор команд, заставившие его что- 
то сделать. Еще более вольно — инструкция 
Рег]. которая может начинаться меткой 
и обычно заканчивается точкой с запятой. 


комбинационный символ — 
сот те сһагасіег 


Любой символ из главной категории СотЫ- 
піпе МагК (\р{6С=М}), который может зани- 
мать или не занимать позицию при выводе. 
Некоторые комбинационные символы не- 
видимы в принципе. Последовательность 
комбинационных символов и основной 
символ графемы, за которым они следуют, 
вместе образуют единый, видимый пользо- 
вателем, символ, который называется гра- 
фемой. Многие, но не все, диакритические 
знаки являются комбинационными симво- 
лами, и наоборот. 


комментарий — соттепі 


Ремарка, не оказывающая влияния на 
смысл программы. В Регі комментарии на- 
чинаются символом # и продолжаются до 
конца строки. 


компилятор — сотрПег 


Строго говоря, это программа, которая 
«пережевывает» другую программу и «вы- 
плевывает» файл. содержащий програм- 
му Е «пригодном для выполнения» виде, 
обычно в виде машинных инструкций. 
Программа регі, согласно этому определе- 
нию, не является компилятором, но в ней 
содержится некий компилятор, который 
принимает программу и преобразует ее 
в более удобную для выполнения форму 
(синтаксические деревья) внутри самого 
процесса рей, которую затем интерпрети- 
рует интерпретатор. Однако существуют 
расширяющие модули, которые придают 
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Рей больше черт поведения «настоящего» 
компилятора. См. главу 16. 


компиляция — сотріїе 
Процесс превращения исходного кода 


в представление, понятное компьютеру. 
См. фаза компиляции. 


конвейер — ріреіпе 

Ряд процессов, соединенных каналами, 
где каждый процесс подает свой вывод на 
вводе следующего. 


конец файла — ЕОЕ 
Конец файла. Иногда метафорически ис- 


пользуется как строка-терминатор внедрен- 
ного документа. 


конкатенация — сопсаќепаііоп 


Процедура, в ходе которой нос одного кота 
приклеивается к хвосту другого, а также 
аналогичная операция для двух строк. 


конструирование — сопѕіёгисі 


Создание объекта с помощью конструк- 
тора. 


конструктор — сопѕігисіог 


Любой метод класса, метод экземпляра 
или подпрограмма, которые создают, ини- 
циализируют, освящают и возвращают 
объект. Иногда мы вольно используем этот 
термин для обозначения формирователя. 


конструкция — сопѕігисі 


Синтаксический элемент, составленный 
из более мелких деталей. 


контекст — сопќехі 


Окружение или среда. Контекст, заданный 
окружающим кодом; определяет, данные 
какого типа должно, как предполагается, 
вернуть конкретное выражение. Сущест- 
вует три основных контекста: списочный 
контекст, скалярный контекст и пус- 
той контекст. Скалярный контекст ино- 
гда подразделяется на булев контекст, чи- 
словой контекст, строковый контекст, 
и пустой контекст. Есть и «безразлич- 
ный» контекст (о котором, если вам инте- 
ресно, говорится в главе 2). 


контекст массива — аггау сопіехі 


Устаревшее выражение, обозначающее то, 
что правильнее называть списочным кон- 
текстом. 


контрольная точка, точка останова — 
ргеаКроіпі 


Место программы, в котором отладчику 
приказано остановить выполнение, чтобы 
можно было осмотреться и выяснить, не 
произошло ли чего-нибудь неправильного. 


контрольное выражение — 
уаќёсһ ехргеѕѕіоп 


Выражение, при изменении значения ко- 
торого происходит остановка в контроль- 
ной точке в отладчике Рег]. 


косвенность — іпдігесііоп 


Если нечто в программе представляет со- 
бой не значение, которое нам нужно. а ука- 
зывает на местонахождение этого значе- 
ния, это косвенность. Она может осущест- 
вляться с помощью жестких ссылок или 
символических ссылок. 


косвенный дескриптор файла — 
іпаігесё # еһапаіе 


Выражение, значение которого можнс ис- 
пользовать в качестве дескриптора файла: 
строка (имя дескриптора файла), ѓуреғіоб, 
ссылка на їуреет1оЬ или объект ввода/выво 
да низкого уровня. 


косвенный объект — іпдігесі објесі 


В английской грамматике так называют 
короткий оборот с существительным меж- 
ду глаголом и его прямым дополнением, 
указывающий на того, к кому относится 
действие (косвенное дополнение). В языке 
Рег] ргіпё 5Т000Т “$Роо\п”; можно понять 
как «глагол косвенное дополнение допол- 
нение», где 5Т000Т является получателем 
действия ргіпі, а “$00” – выводимым объ- 
ектом. Аналогично при вызове метода 
можно поместить вызывающего между ме- 
тодом и его аргументами: 


$9011 = пем Раїћетіс: :Сгеатиге 
"Ѕтеадо1"; 

91\%е $9011ит "Ғіѕ5555һ! "; 

о1уе Фодо11ит "Ргесіоиѕ! ”; 
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кракозябры — шойБаке 

Когда вы говорите на одном языке, а ком- 
пьютер думает, что вы говорите на дру- 
гом. Из-за ошибок трансляции, когда вы 
передаете текст в кодировке ОТЕ-8, на- 
пример, а компьютер думает, что имеет 
дело с кодировкой ГаЙп-1, он выведет эти 
самые кракозябры. На японском этот тер- 
мин записывается как [Х 37440) | и означа- 
ет «испорченные символы». Произношение 
в стандартном фонетическом алфавите ІРА 
записывается как [тод21баке] и читается 
примерно так «мо-джи-ба-ке». 


культ даров небесных — сагро си 


Копирование фрагментов программного 
кода без его понимания, но со слепой верой 
в его ценность. Этот термин происходит 
из доиндустриальных культур, в которых 
людям приходится сталкиваться с арте- 
фактами, оставленными исследователями 
или колонизаторами из технологически 
развитых культур. См. «Тһе Содѕ Миз$ Ве 
Стату» («Боги наверное сошли с ума»). 


кэш — сасһе 


Хранилище данных. Вместо того, чтобы 
многократно производить дорогостоящие 
вычисления, чтобы получить один и тот 
же результат, лучше вычислить его один 
раз и сохранить в кэше. 


левостороннее значение — Іуаіџе 


Термин, которым законники языка 060: 
значают адрес памяти, которому можно 
присваивать новые значения, например, 
переменная или массив. Буква «1» означа- 
ет «Іеѓі», т.е. левую часть присваивания, 
типичного места для левосторонних значе- 
ний. іоаіиаЫе в отношении функций или 
выражений означает те из них, которым 
могут присваиваться значения, как, на- 
пример, в роз($х) - 10. 


лексема — 1ехете 
Иное название маркера (оКеп). 


лексема — іокеп 


Морфема в языке программирования, наи- 
меньшая единица текста с семантической 
значимостью. 
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лексическая область видимости — 
Іехіса] зсорше 

Изучение «Охга ЕпеіѕҺ Гісііопагу» 
в микроскоп. (Известна также как ста- 
тическая область видимости, поскольку 
словари меняются медленно.) Аналогично 
рассматривание переменных, хранимых 
в личном словаре (пространстве имен), для 
каждой области видимости, которые вид- 
ны только от точки объявления до конца 
лексической области видимости, в кото: 
рой они определены. Синоним — статиче- 
ская область видимости. Антоним – ди- 
намическая область видимости. 


лексическая переменная — 
Іехіса! уачае 


Переменная, на которую действует лекси- 
ческая область видимости, объявленная 
с помощью пу или зіаїе, Часто называется 
просто «Іехіса]». (Ключевое слово оиг объ- 
являет переменную с лексической обла- 
стью видимости для глобальной перемен- 
ной, которая сама не является лексической 
переменной.) 


лексический анализ — Іехісаі апаЇіуѕіѕ 


Иное название для разбиения на лексемы 
(ғокепігіпв). 


лексический анализатор — Іехег 
Иное название для ѓокепег. 


лексический анализатор — іокепег 


Модуль, разбиваклций текст программы 
на последовательность лексем для после- 
дующего анализа синтаксическим анали- 
затором. 


лень — Іағіпеѕѕ 


Качество, заставляющее прикладывать 
большие усилия, чтобы сократить общий 
расход энергии. Оно заставляет писать эко- 
номящие труд программы, которые ока- 
жутся полезными другим людям, и доку- 
ментировать то, что вы написали, чтобы не 
приходилось слишком много отвечать на 
вопросы. Посему это первая великая добро- 
детель программиста. Посему и эта книга. 
См. также нетерпеливость и высокомерие. 
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литерал — Шега| 


Лексема в языке программирования, на- 
пример число или строка, которые дают 
фактическое значение, а не просто пред- 
ставляют возможные значения, как это де- 
лает переменная. 


логический оператор — 1061са! орегафог 


Символы, представляющие понятия «и». 
чили», «исключающее или» и «не». 


ложь — #5е 


В Рег] это любое значение, которое выгля- 
дит как `` или "0", если вычислено в стро- 
ковом контексте. Поскольку неопреде- 
ленные значения вычисляются как ``, все 
неопределенные значения ложны, но не 
все ложные значения являются неопреде- 
ленными. 


локальный — 1юса] 


Не всегда означает одно и то же. Глобаль- 
ная переменная Рег! может быть локализо- 
вана внутри динамической области види 
мости посредством оператора 1оса1. 


массив — аггау 


Упорядоченная последовагельность значе- 
ний, хранимых так, что к любому из них 
можно легко обратиться по целочисленно- 
му индексу, задающему смещение значе- 
ния в последовательности. 


метазнак — пефазутЬ о 


Нечто, что мы назвали бы метасимво 
лом, если бы не то обстоятельство, что это 
последовательность из более чем одного 
символа. Обычно первым символом этой 
последовательности является настоящий 
метасимвол, который заставляет осталь- 
ные символы метазнака тоже вести себя 
особым образом. 


метасимвол — шефасБагасег 

Символ, предполагающий необычную 
интерпретацию. Какие именно символы 
должны восприниматься как метасимво- 
лы, в значительной мере зависит от кон- 
текста. В каждом конкретном интерпре- 
таторе команд имеются свои метасим- 
волы, заключенные в двойные кавычки, 
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строки в Рег! имеют другие метасимволы, 
а шаблоны регулярных выражений имеют 
все метасимволы двойных кавычек плюс 
свои собственные. 


метка — 1а5@ 


Имя, которое мы даем инструкции, чтобы 
можно было ссылаться на нее в любом мес 
те программы. 


метка цикла — 1юор 1аЪе] 


Некий ключ или имя, закрепленные за 
циклом, чтобы инструкции управления 
циклом могли указывать, каким циклом 
они управляют. 


метод — те то 

Определенного рода действие, которое 
объект может выполнить, если попросить 
его об этом. См. главу 12. 


метод класса — сЇаѕѕ теіћой 


Метод, для которого вызов производится 
от имени пакета, а не ссылки на объект. 
Метод, ассоциируемый с классом в целом. 


метод экземпляра — 1п5ќапсе теіћоа 


Метод объекта, как противоположность 
методу класса. 


Метод, инвокантом которого являет- 
ся объект, а не имя пакета. Каждый объ: 
ект класса обладает всеми методами этого 
класса, т.е. метод экземпляра применяет- 
ся к конкретному экземпляру класса, а не 
ко всем экземплярам. См. также метод 
класса. 


меченый — ќаіпќей 


Относится к данным, полученным из гряз- 
ных рук пользователя, на которые поэтому 
не может полагаться надежная программа. 
Рег осуществляет проверку меченых дан- 
ных, если выполняется программа ѕеѓиій 
(или зенла) либо если указан ключ -Т. 


минимализм — пипппа От 


Вера в то, что «малое прекрасно». Пара- 
доксально, но если сказать что-то на ма- 
леньком языке, оно становится большим, 
а если сказать что-то на большом языке, 
оно становится маленьким. Решайте сами. 
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многомерный массив — 
пи @1пепзюопа! аггау 


Массив, требующий указать несколько ин- 
дексов, чтобы найти один элемент. Рег] реа- 
лизует их с помощью ссылок - см. главу 9. 


множественное наследование — 
шие іпһегіќапсе 


Черты, приобретенные от матери и отца, 
смешанные непредсказуемым образом. 
(См. наследование и одиночное наследова- 
ние.) В языках программирования (вклю- 
чая Рег!) представление о том, что у данно- 
го класса может быть несколько прямых 
предков, или базовых классов. 


модификатор — тойібег 

См. модификатор инструкции, модифи- 
катор регулярного выражения и модифи- 
катор левостороннего значения, не обяза- 
тельно в указанном порядке 


модификатор инструкции — 

ѕїаќетепіё шоб ШНег 

Условие или цикл, помещаемые после ин- 
струкции, а не перед ней, если вы пони- 
маете, о чем мы говорим. 


модификатор левостороннего значения — 
1уаШше то ег 


Адъективированная (играющая роль при- 
лагательного) псевдофункция, которая ис- 
кажает смысл левостороннего значения 
некоторым декларативным образом. В на- 
стоящее время есть три модификатора ле- 
восторонних значений: пу, оџг и 1оса1. 


модификатор регулярного выражения — 
герщаг ехргеѕѕіоп то ег 


Параметр для шаблона или подстановки, 
например /1, для придания шаблону не- 
чувствительности к регистру. 


модуль — тойше 

Файл, определяющий пакет с (почти) тем 
же именем, который может либо экспорти- 
ровать символы, либо функционировать 
как класс объекта. (Главный файл модуля 
„рт может также загружать другие файлы 
для поддержки модуля.) См. встроенную 
функцию и5е. 
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модуль — тодии$ 


Целочисленный делитель, если һас инте- 
ресует остаток, а не частное. 


мягкая ссылка — 504 геЃегепсе 
См. символическая ссылка. 


на проходе — еп раѕѕапё 


Когда значение изменяется во время копи- 
рования. [От французского «на проходе», 
как в необычном маневре взятия пешки 
в шахматах.] 


надкласс (суперкласс) — зпрега$$ 
См. базовый класс. 


наследование — іпһегіќапсе 


То, что мы получаем от своих предков – ге- 
нетически или иным способом. Если нечто 
представляет собой класс, тс предки этого 
называются базовыми классами, а потом- 
ки – производными классами. См. одиноч- 
ное наследование и множественное насле- 
дование. 


нетерпеливость — итраЧМепсе 

Гнев, который вы испытываете, когда ком- 
пьютер ведет себя лениво. Это заставляет 
писать программы, которые не просто рев- 
гируют на наши потребности, но предвос- 
хищают их. Или по крайней мере делают 
вид. Посему является второй великой доб- 
родетелью программиста. См. также лень 
и высокомерие. 


нижний регистр — 1юхегсазе 

ВЮникоде к нижнему регистру относятся 
не только символы из категории Г.о\уегсазе 
Гейег, но и любые символы со свойством 
Гомегсаѕе, включая символы из категорий 
Модібег Геіфегѕ, Геіег Мотђегѕ, а также 
некоторые символы из категорий ОШег 
Ѕутђо!ѕ и Сотбіпіпе Магк. 


номер ошибки — еггпо 

Номер ошибки, возвращаемый при неуда- 
че системного вызова. Рег| ссылается на 
ошибку через $! (или $0$_ЕВВОВ, если вы ис- 
пользуете модуль Епд115ћ). 


номер строки — іпе питзБег 


Число строк, прочитанных до сих пор, 
плюс одна. Регі ведет отдельную нумера- 
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цию строк для каждого открытого им ис- 
ходного или входного файла. Текущий но- 
мер строки файла исходного текста пред- 
ставлен в __1Т\Е__. Номер текущей строки 
ввода (для файла, который последним чи- 
тался через <ЕН>) представляется перемен- 
ной $. ($1МРЫТ ІІМЕ М№ОМВЕВ). Многие сообще- 
ния об ошибках содержат оба значения, 
если они доступны. 


нормализация — погтаН2айоп 


Преобразование текстовой строки в аль- 
тернативное, но эквивалентное ланони- 
ческое (или совместимое) представление, 
в котором строки можно сравнивать, что- 
бы определить их равенство. Юникод оп- 
ределяет четыре различные формы норма- 
лизации: МЕР, МЕС, МЕК” и МЕКС. 


носильщик ~ рогіег 


Некто, «переносящий» программное обес- 
печение с одной платформы на другую. 
Перенос программ, написанных на плат- 
формозависимых языках, таких как С, 
может быть трудным делом, но перенос та- 
ких программ, как Рег, стоит перенесен- 
ных мучений. 


нулевая ширина — 2его уійёһ 


Утверждение в подшаблоне, соответствую- 
щее нулевой строке между символами. 


нулевой символ — пи сһагасіег 


Символ со значением АЗСПИ «ноль». Ис- 
пользуется в С для завершения строк, но 
в Ре! строка может содержать символы 
пи11. 


нумификация — пап Ясайоп 

(Иногда произносится как нуммифика 
ция.) На жаргоне Рег! обозначает неявное 
преобразование в число; связанный гла- 
гол - нумифицировать. Слово нумифика- 
ция было придумано для рифмования со 
словом мумификация, а глагол нумифици- 
ровать - с глаголом мумифицировать. Не 
имеет отношения к религиозному «питеп, 
питіпа, питіпоиѕ». Первоначально мы до- 
пустили ошибку, опустив в слове «питті- 
Нсайоп» одну букву «т», и многие просто 
привыкли к нашему необычному правопи- 
санию. Видимо, когда придумали назва- 
ние заголовка НТТР АЕҒЕВЕВ с одной пропу- 


щенной буквой, наше правописание было 
где-то поблизости. 


обертка — мгаррег 


Программа или подпрограмма, которая 
запускает за нас другую программу или 
подпрограмму, частично модифицируя ее 
входные и выходные данные для лучшего 
соответствия нашим задачам. 


область видимости — ѕсоре 


Как далеко видна переменная. В Рег! есть 
два механизма видимости. Динамическая 
область видимости переменных 1оса1 оз- 
начает, что оставшаяся часть блока и лю- 
бые подпрограммы, вызываемые в остав- 
шейся части блока, могут видеть перемен- 
ные, локальные для блока. Лексическая об: 
ласть видимости переменных пу означает, 
что оставшаяся часть блока может видеть 
переменную, но другие подпрограммы, 
вызываемые блоком, не могут видеть пере- 
менную. 


обработка исключительных ситуаций — 
ехсерііоп ВапаНпЕ 


Реакция программы на возникновение 
ошибки. Механизм обработки исключи- 
тельных ситуаций в Рег реализуется опе- 
ратором е\а1. 


обработчик — вап ег 


Подпрограмма или метод, вызываемые 
в ответ на какое-то внутреннее событие, 
например сигнал, или при вызове перегру- 
женного оператора. См. также обратный 
вызов. 


обработчик сигнала — ѕіғпа1 Бап ег 


Подпрограмма. которая вместо того, чтобы 
удовлетвориться тем, что ее вызовут обыч- 
ным образом, сидит и ждет грома среди яс- 
ного неба, чтобы соизволить выполниться. 
В Рег] гром среди ясного неба носит назва- 
ние сигнала, а посылаются они с помощью 
встроенной функции кі11. См. описание хе- 
ша %516 в главе 25 и раздел «Сигналы» гла- 
вы 15. 


обратная совместимость — 

Баскуага сотрай Шу 

Означает сохранение возможности пользо- 
ваться старыми программами, поскольку 
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мы не устранили функции или ошибки, на 
которых они основывались. 


обратный вызов — саЊаск 


Обработчик, регистрируемый в какой-ли- 
бо части программы в надежде, что другая 
часть программы запустит его при появ- 
лении некоторого события, представляю- 
щего интерес. 


общественное достояние — ри Ис Чота1т 


Нечто, владельцем чего не является ни- 
кто. Ре! защищен авторским правом и не 
является общественным достоянием — он 
просто бесплатно доступен и бесплатно 
распространяется. 


объект — ођјесі 


Экземпляр класса. Нечто, «знающее», что 
собой представляет определенный пользо- 
вателем тип (класс) и что оно может делать 
согласно этому классу. Программа может 
попросить объект что-то сделать, а объект 
будет решать, хочет он это делать или нет. 
Одни объекты более любезны. чем другие. 


объект ссылки — геЃегепі 


То, на что указывает ссылка, обладающее 
(или не обладающее) именем. Обычными 
объектами ссылок являются скаляры, мас- 
сивы, хеши и подпрограммы. 


объявление — Че ага оп 


Утверждение о том, что нечто существует; 
возможно, описывающее это нечто, но не 
содержащее никаких указаний на время, 
место и способ применения этого. Объяв- 
ление - это как часть рецепта, где сказано: 
«две чашки муки, одно большое яйцо, че- 
тыре-пять головастиков...•. Противополож- 
ность объявлению — инструкция. Обрати- 
те внимание, что некоторые объявления 
одновременно служат инструкциями. Объ- 
явление подпрограммы действует так же, 
как определение, если прилагается ее тело. 


ограничитель — ЧейтИег 


Символ или строка, устанавливающие 
границы текстового объекта произвольно- 
го размера, которые не надо путать с раз- 
делителем (ѕерагаіѓог) или терминатором 
(ғегтіпаїіог). «Ограничивать» в действи- 
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тельвости значит «окружать» или «заклю- 
чать» (подобно данным круглым скобкам). 


одиночное наследование — 
эниЛе іпһегійќапсе 


Черты, которые некто приобрел от матери, 
если она сообщила ему, что у него нет отца. 
(См. также наследование и множествен- 
ное ниследование.) В языках программи- 
рования представление о неполовом раз- 
множении классов, вследствие какового 
у данного класса может быть только один 
прямой предок, или базовый класс. Рей не 
накладывает такого ограничения, хотя, 
программировать на Рег! можно и в таком 
стиле, если есть желание. 


однострочник — опе-Їіпег 


Целая компьютерная программа. втисну- 
тая в одну строку. 


оккультный знак — $5 

Знак, используемый в магии. В Рег — сим- 
вол перед именем переменной, такой как $, 
@ или %. 


операнд — орегап@ 


Выражение, к значению которого приме- 
няется оператор. См. также приоритет.. 


оператор — орегафог 


Штука, которая преобразует некоторое 
число входных значений в некоторое чис- 
ло выходных значений, часто встраивае- 
мая в язык с помощью специального син- 
таксиса или символа. Этот самый оператор 
может иметь определенные ожидания от: 
носительно того, какие типы данных мы 
передаем ему в качестве аргументов (опе- 
рандов) и какого типа данные собираемся 
получить от него. 


оператор объявления — де агафог 


Нечто, сообщающее вашей программе, ка- 
кого рода переменные вы хотели бы полу- 
чить. Рег не требует объявления перемен- 
ных, но вы можете использовать пу, оиг или 
ѕїаїе, чтобы указать, что хотели бы полу- 
чить кое-что, отличное от того, что будет 
создано по умолчанию. 
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оператор отношения — га юпа] орегаѓог 


Оператор, который сообщает, является ли 
истинным для пары операндов некоторое 
конкретное огношение порядка. В Рег есть 
операторы отношения для чисел и строк. 
См. сортирующая последовательность. 


оператор прямого доступа к памяти — 
а94ге55 орегафог 


Некоторые языки работают непосредст- 
венно с адресами величин в памяти, но это 
игра с огнем. Рен предоставляет комплект 
асбестовых перчаток для работы с памя- 
тью. В Рей] ближе всего к оператору адреса 
стоит оператор обратной косой черты, но 
он дает жесткую ссылку, что значительно 
безопаснее, чем адрес памяти. 


оператор тестирования файла — 
Ғе іеі орегафог 


Встроенный унарный оператор, исполь- 
зуемый для проверки истинности како- 
го-либо утверждения о файле; например, 
-о $ғ11епате проверяет, являетесь ли вы 
владельцем файла. 


операционная система — 

орегаііпе зуфет 

Особая программа, которая выполняется 
на голой машине и скрывает детали управ- 
ления процессами и устройствами. Обыч- 
но употребляется в более вольном смысле, 
обозначая определенную культуру про- 
граммирования. Вольный смысл может 
интерпретироваться на разных уровнях 
конкретности. Одной крайностью будет 
сказать, что все версии ОМХ и ОМІХ-по- 
добных систем суть одна и та жеоперацион- 
ная система (очень многих этим расстроив, 
особенно законоведов и адвокатов). Другая 
крайность — сказать, что данная конкрет- 
ная версия операционной системы данно- 
го конкретного поставщика отличается 
от всех других версий операционных сис- 
тем любых поставщиков. Ре! значительно 
лучше переносится между операционны- 
ми системами, чем многие другие языки. 
См. также архитектура и платформа. 


опережающая проверка — Іоокаһеаа 


Утверждение, которое заглядывает в стро- 
ку правее текущего найденного соответст- 
вия. 
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определенный -- деЙпей 


Имеющий значение. Рег! полагает, что не- 
которые вещи из тех, которые люди пыта- 
ются делать, лишены смысла, в частности 
использование переменных, которым не 
присвоено значение, и осуществление не- 
которых действий над данными, когорых 
нет. Например, при попытке чтения за пре- 
делами конца файла Рет| возвращает неоп- 
ределенное значение. См. также ўаіѕе и опе- 
ратор йеѓіпед в главе 27. 


опции — орііопѕ 
См. ключи или модификаторы регулярных 
выражений. 


освящение — Ыеѕѕ 


В жизни корпораций означает предостав- 
ление официального одобрения чего-либо. 
например: «Вице-президент по инжини- 
рингу благословил наш проект МеђСгип- 
сһег». Аналогично в Регі это слово означает 
предоставление официального одобрения 
на то, чтобы объект ссылки мог функцио 
нировать как объект, например объект 
УеБСгипсћег. См. описание функции 01е55 
в главе 27. 


остроконечник (обратный порядок 
следования байтов) — 1 1е-еп ап 


Из Свифта: тот, кто разбивает яйцо с ост- 
рого конца. Употребляется также в отно- 
шении компьютеров, хранящих младший 
байт слова в младшем адресе, а старший 
байт – в старшем. Часто считается, что та- 
кие компьютеры превосходят «тупоконеч- 
ные» машины. См. также тупоконечник 
(прямой порядок следования байтов). 


отображение регистра — саѕетарріпе 


Процесс преобразования символов стро- 
ки в один из четырех регистров, поддер- 
живаемых Юникодом; в Ре! реализуется 
функциями ГС, 1с. исѓігѕї и ис. 


отправлять — діѕраісћ 


Посылать что-либо в правильное место. 
Часто употребляется метафорически, оз- 
начая передачу программного управле- 
ния в точку, выбранную алгоритмически, 
часто путем поиска в таблице ссылок на 
функции или, в случае методов объекта, 
при обходе дерева наследования в поисках 
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самого специализированного определения 
метода. 


охватывающий оператор — 
сігсштііх орегаѓог 


Оператор, охватывающий свой операнд, 
подобно оператору угловых скобок, или 
круглым скобкам, или объятиям. 


очистка буфера -- 155 


Действие, состоящее в опустошении буфе- 
ра, часто при его переполнении. 


ошибка — еггог 
См. исключение или фатальная ошибка. 


пакет — расКаре 


Пространство имен для глобальных пе- 
ременных, подпрограмм и т. п., предназна- 
ченное, чтобы хранить их отдельно от одно- 
именных символов в других пространствах 
имен. В некотором смысле только пакет 
являе:ся глобальным, так как символы 
в таблице символов пакета доступны за его 
пределами только через упоминание паке- 
та. Но в другом смысле все символы пакета 
являются глобальными – это просто хоро- 
шо организованные глобальные символы. 


память — тетогу 


Всегда означает операгивную память, а не 
диск. Осложняет дело то обстоятельство, 
что на машине может быть реализована 
виртуальная память, т.е. машина будет 
делать вид, что у нее больше памяти, чем 
есть на самом деле, используя дисковое 
пространство для хранения неактивных 
страниц памяти. При этом может пока- 
заться, что памяти несколько больше, чем 
есть на самом деле, но виртуальная память 
не является заменой настоящей памяти. 
Самое хорошее, что можно сказать о вир- 
туальной памяти, — она позволяет произ- 
водительности падать постепенно, а не вне- 
запно, когда кончается память настоящая. 
Но программа может умереть, когда закон- 
чится и виртуальная память тоже, если 
раныпе вы не загоните свой диск до смерти. 


память совместного доступа — 
5Ваге тешогу 


Участок памяти, к которому имеют дос- 
туп два разных процесса, которые в ином 
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случае не имели бы возможности видеть 
память друг друга 


параметр – рагатеег 
См. аргумент. 


патч — раёсћ 


«Заплатка» – исправление путем наложе- 
ния. На языке хакеров — список различий 
между двумя версиями программы, ко- 
торый можно применить с помощью про- 
граммы рай (1), чтобы исправить ошибку 
или обновить старую версию. 


перевод строки — пеміпе 

Одиночный символ, представляющий ко- 
нец строки, со значением АЗСП «восьме- 
ричное 012» в ОМІХ (но 015 в Мас) и пред- 
ставляемый метазнаком \л в строках Рег]. 
В оџерационных системах Міпіоумѕ, при 
выводе в текстовые файлы и в некоторые 
физические устройства, такие как терми- 
налы, одиночный символ перевода строки 
автоматически транслируется библиоте- 
кой С в перевод строки и возврат каретки, 
но обычно никакой трансляции не произ- 
водится. 


перегрузка — оуе|оа те 


Сообщение дополнительного смысла сим- 
волу или конструкции. Фактически лю- 
бые языки в той или иной мере производят 
перегрузку, поскольку человек умеет опре 
делять смысл из контекста. 


перегрузка операторов — 
орегафог оуегіоайіпе 


Вид перегрузки, который можно произво- 
дить для встроенных операторов, чтобы за- 
ставить их работать с объектами, как если 
бы они были обычными скалярными зна- 
чениями, но с фактической семантикой, 
предоставляемой классом объекта. Пере- 
грузка устанавливается прагмой оуеоад — 
см. главу 13. 


переключатель — змНсВ ѕзќаіетепі 


Прием программирования, позволяющий 
вычислить выражение и искодя из его зна- 
чения осуществить переход к одному из не- 
скольких участков кода. Называется так- 
же «сазе зігисіџге», в честь одноименной 
конструкции языка Разса]. Большинство 
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переключателей в Рег! записываются по- 
средством діуеп. См. «Инструкция #1уеп» 
в главе 4. 


переменная — уаглае 


Именованный адрес ячейки памяти, спо- 
собной хранить значение любого типа, не- 
обходимое вашей программе. 


переменная окружения — 
епуігопшепі уагіаЫе 


Механизм, посредством которого некий 
агент более высокого уровня, например 
пользователь, может сообщить о своих 
предпочтениях будущему потомку (поро- 
жденному процессу, внучатому процессу 
и т.д.). Каждая переменная среды пред- 
ставляет собой пару ключ/значение, как 
элемент в хеше. 


переменная экземпляра -- 
іпѕіапсе уагіаЫе 


Атрибут объекта; данные, хранимые 
в конкретном объекте, а не в классе. 


переменные захвата — сарбиге уагіаЫеѕ 


Переменные, такие как $1 и $2, а также %+ 
и %-, которые хранят текст, захваченный 
при поиске по шаблону. См. главу 5. 


переносимый — рогіаЫе 


Когда-то относилось к коду на С, который 
можно было компилировать в любой из сис- 
тем ВЗ” и 5уѕУ. В общем, код, который лег- 
ко преобразовать для выполнения на дру- 
гой платформе, где «легко» можно опре- 
делить любым способом, что обычно и про- 
исходит. Все можно считать переносимым, 
если хорошенько постараться, например 
передвижной дом или Лондонский мост. 


песочница — ѕапдђох 


Огороженная область, происходящее в ко- 
торой не затрагивает окружающее про- 
странство. Вы позволяете детям играть 
и не пускаете их на дорогу. См. главу 20. 


плавающая запятая — ПоаііпЕ роіпё 


Способ хранения чисел в «экспоненциаль- 
ной записи», когда точность представления 
числа не зависит от того, насколько оно 
велико (десятичный разделитель – точка 
или запятая – «плавают»). Ре] производит 


работу с числами с плавающей запятой, 
если целых чисел оказывается недостаточ- 
но. Числа с плавающей запятой являются 
приближением действительных чисел. 


платформа – ріаіѓогт 


Программно-аппаратный контєкст, в кото- 
ром выполняется программа. Программа, 
написанная на языке, зависящем от плат- 
формы, может слететь, если изменить ма- 
шину или операционную систему, или биб- 
лиотеку, или компилятор, или системную 
конфигурацию. Интерпретатор регі дол- 
жен компилироваться отдельно для каж- 
дой платформы, потому что он реализован 
на С, но программы, написанные на языке 
Регі, в значительной мере платформонеза- 
висимы. 


по умолчанию — деѓЃаші 


Значение, выбранное за вас, если вы не 
указали собственное. 


побочные эффекты — ѕійе еЁѓесіѕ 


Нечто дополнительное, что происходит при 
вычислении выражения. В настоящее вре- 
мя это может касаться почти чего угодно. 
Например, простой оператор присваива- 
ния имеет «побочный эффект» — присваи: 
вание значения переменной. (А вы думали, 
что присваивание значения было вашей 
главной целью!) Аналогично присваива- 
ние значения специальной переменной $| 
(ФАИТОРЦИЗН) имеет побочный эффект, за- 
ключающийся в принудительном очище- 
нии буфера после каждой операции мгіїе 
или ргіпї с выбранным в данный момент 
дескриптором файла. 


подкласс — ѕ1Ьсіаѕѕ 
См. производный класс. 


подпрограмма - зобгоиипе 


Доступный по имени или иным образом 
участок программы, который можно вы- 
звать из любого места программы, чтобы 
выполнить некоторую подзадачу програм- 
мы. Подпрограмма часто имеет парамет- 
ры, позволяющие менять ее поведение 
в рамках определенного круга задач в за- 
висимости от входных аргументов. Если 
подпрограмма возвращает осмысленное 
значение, ее называют также функцией. 
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подстановка ~ зи и вот 


Изменение частей строки через оператор 
5///. (Мы избегаем использования этого 
термина в значении интерполяции пере- 
менных.) 


подстрока — ѕиђѕёгіпє 


Часть строки, начинающаяся с некоторой 
позиции символа (смещения) и охватываю- 
щая некоторое число символов. 


подход ящика е инструментами — 
фооБох арргоасһћ 


Идея состоит в том, что с полным набором 
простых взаимодополняющих инструмен- 
тов можно создать почти все, что нужно. 
Это хорошо, когда надо собрать трехколес- 
ный велосипед, но если мы создаем что-то 
необычное!, нам понадобится собственный 
механический цех, в котором можно соз- 
давать специальные инструменты. Регі – 
своего рода механический цех. 


подшаблон — зиБрайеги 


Компонент шаблона регулярного выраже- 
ния. 


подшаблон кода ~ соде зиБравегп 
Подшаблон регулярного выражения, дей- 
ствительной задачей которого является 
выполнение некоторого кода Рег]. Так ве- 
дут себя, к примеру, подшаблоны (?{...}) 
и (?2{...}). 


позиция косвенного объекта — 

іпдігесі ођјесі 5108 

Синтаксическая позиция между вызовом 
метода и его аргументами при использо- 
вании синтаксиса вызова косвенного объ- 
екта. (Позиция отличаетсн отсутствием 


1001 


запятой между ней и следующим аргумен- 
том.) В следующем примере 5ТрЕВЕ являет- 
ся позицией косвенного объекта: 


ргіпі ТРЕВА "Амаке! Амаке! 
Ғеаг, Е1ге, Ғоеѕ! Амаке! \п”; 


поиск по шаблону — раіќегп шас ше 


Означает взять шаблон, обычно являю- 
щийся регулярным выражением, и попы- 
таться различными способами наложить 
єго на строку, чтобы найти соответствие. 
Часто применяется, чтобы найти в файле 
интересующие участки данных. 


поиск с возвратом — Баскігаскіпс 


Обычай говорить: «Если бы начать все сна- 
чала, я бы все сделал иначе» — и затем дей- 
ствительнс возвращаться и делать все по- 
другому. На математическом языке это 
означает возврат из безрезультатной ре- 
курсии по дереву возможностей. Ре! осу- 
ществляет поиск с возвратами при попыт- 
ке найти соответствие шаблону с помощью 
регулярного выражения, когда из преж- 
них попыток ничего не вышло. См. раздел 
«Маленький Механизм, который /(не)? мо- 
жет/» в главе 5. 


поле — беја 


Фрагмент числовых или строковых дан- 
ных, являющийся частью более длинной 
строки или записи. Поля переменной ши- 
рины обычно перемежаются разделите- 
лями (а извлекаются посредством $р11\), 
тогда как поля фиксированной ширины 
обычно находятся в фиксированных пози- 
циях (и тогда нужно использовать ипргск). 
Переменные экземпляра тоже называют 
«полями». 


1 Воригинале говорится о приборе деѓгапіѕһіг1пе сотђоѓіих геригва1аќог – разупрощающем 
сложнопоточном регургаляторе; слово «регургалятор» раньше было длиннее и читалось 
«регуругалятор», обозначая некое приспособление, при помощи которого йоги могли очень 
долго вдыхать (іпһа]е) продукты сухой возгонки сложных растительных смесей (в замкну- 
том цикле, это важно), достигая в результате нирваны и просветления. Впоследствии секрет 
этого приспособления был утерян, йоги больше не достигают просветления, а лишь впада- 
ют в нирвану (внешне это напоминает спячку, только человек при этом сидит и раскачива- 
ется, время от времени что-то тихонько напевая). Но слово не исчезло. Буква «у» редуциро- 
валась и термин обозначает теперь довольно несложный, хотя и секретный прибор (регурга- 
лятор), состоящий на вооружении армии США. – Прим. ред. 
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полиморфизм — роутогр 

Идея заключается в том, что можно при- 
казать объекту выполнить некоторое ро- 
довое действие, и объекты интерпретиру- 
ют команду различными способами, в за- 
висимости от своих типов. [От греческого 
пом- + рорфй – много форм.] 


полубайт — пуБЫе 
Половина байта, эквивалентная одной ше- 


стнадцатеричной цифре и занимающая че- 
тыре бита. 


поразрядный сдвиг — Ы 5 
Перемещение битов влево или вправо в ма- 
шинном слове, которое приводит к умно- 
жению или делению на степень двойки. 


порт — рогі 

Часть адреса ЧСР или ОБР, которая на- 
правляет пакеты нужному процессу, най- 
дя нужную машину, — нечто вроде доба- 
вочного номера, который мы сообщаем, 
дозвонившись до коммутатора компании. 
Кроме того, означает результат преобразо- 
вания кода для платформы, отличной от 
избранной первоначально. 


порядковое — ог@та| 


Целочисленное значение абстрактного сим- 
вола. То же, что код символа. 


порядок поиска методов — 
теѓћоа гезошНоп ог4ег 


Порядок обхода записей в ОТК. По умолча- 
нию выполняется двойной поиск методов 
в глубину, сначала среди определенных 
методов, а потом в блоке АЦТОШАО. Однако 
Рег позволяет изменять порядок с помо- 
щью пго. 


порялок следования байтов — епдіап 

См. тупоконечник (прямой порядок следо- 
вания байтов) и остроконечник (обрат- 
ный порядок слебования байтов). 


поступательный поиск — 

ргоргеѕѕіуе таѓсһіпо 

Поиск по шаблону, продолжающий работу 
с того места, где остановился в предыду- 
щий раз. 
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постфиксный оператор — роѕіѓіх 


Оператор, следующий за своим операн- 
дом, например $х++. 


поток — ѕїгеат 


Поток данных в процесс или из процесса 
как устойчивая последовательность бай- 
тов или символов без видимости разбиения 
на пакеты. Это своего рода интерфейс - со- 
ответствующая реализация вполне может 
разбивать данные на пакеты для доставки, 
но это скрыто от пользователя. 


поток выполнения - іһгеаа 


Подобен ответвленному процессу, но без 
присущей ѓогк защиты памяти. Поток вы- 
полнения — более легковесный, чем полно- 
ценный процесс, так как процесс может 
иметь несколько потоков, выполняемых 
в нем, и все они претендуют на простран- 
ство памяти одного и того же процесса, ес- 
ли только не предпринимаются шаги для 
защиты потоков друг от друга. 


право первого — Ѓігѕі-соте 


Первый, выгрузивший на сервер РАСЕ 
«пространство имен», автоматически ста- 
новится главным хранителем этого про- 
странства имен. Привилегии, полученные 
автоматически по «праву первого», отлича- 
ются от привилегий главного хранителя, 
которые могут передаваться другим лицам. 


правостороннее значение -— гуаше 


Значение, которое можно поместить в пра- 
вой части присваивания. См. также лево- 
стороннее значение. 


прагма (директива) — ргабта 
Стандартный модуль, практические сове- 
ты и предложения которого получаются 
(и, возможно, игнорируются) на этапе ком- 
пиляции. Имена прагм задаются целиком 
в нижнем регистре. 


предупреждение — уагпіпе 

Сообщение, выводимое в поток ЭТОЕВН с це- 
лью показать, что есть проблемы, но не на- 
столько серьезные, чтобы прекратить ра- 
боту. См. магп в главе 27 и прагму магп1пд$ 
в главе 29. 
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преобразование в строку — ѕігіпріѓісаііоп 


Процесс создания представления абстракт- 
ного объекта в виде строки. 


препроцессинг, предварительная 
обработка — ргергосез те 


То, что некоторый вспомогательный про- 
цесс осуществил для преобразования вход- 
ных данных в форму, более пригодную для 
текущего процесса. Часто выполняется 
через входной канал. См. также препроцес- 
сор С. 


препроцессор С — С ргергосеѕѕог 

Первый проход типичного компилятора С, 
в котором обрабатываются строки, начи- 
нающиеся символом #, для условной ком- 
пиляции и макроопределений, а также 
осуществляются различные манипуляции 
с текстом программы на основе текущих 
определений. Известен также как срр(1). 


префиксный оператор — ргейх 
Оператор, предшествующий своему опе- 
ранду, например ++$х. 


приведение типа — буре са5Ипя 
Преобразование данных из одного типа 
в другой. Язык С допускает это. Ре] не ну- 
ждается в этом. И не хочет этого. 


привязка — Ыпё 


Назначение конкретного сетевого адреса 
сокету. 


приложение — аррісайоп 

Разновидность больших и сложных про- 
грамм с замысловатым названием, чтобы 
люди не замечали, что пользуются про- 
граммой. 


приоритет — ргесейепсе 

Правила поведения, которыми, в отсутст- 
вие других указаний, определяется, что 
должно произойти раньше. Например, при 
отсутствии скобок умножение всегда вы- 
полняется раньше сложения. 


присваивание — авыгитет 


Оператор, цель которого — изменять зна- 
чение переменной. 
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присваивания, оператор — 
аѕѕісптепќё орегафог 


Обычное присваивание. либо составной 
оператор, образованный из обычного при- 
сваивания и некоторого другого оператора, 
который изменяет значение переменной по 
месту, т.е. относительно ее прежнего значе- 
ния. Например $а += 2 прибавляет 2 к $а. 


пробельный символ — уһіќеѕрасе 
Символ, который перемещает курсор, но 
ничего на экран не выводит. Обычно отно- 
сится к любому из символов: пробел, табу- 
ляция, перевод строки, возврат каретки, 
перевод формата. В Юникоде соответству 
ет многим другим символам, включая №ъ№- 
ВКЕАК ЅРАСЕ. 


проверка меченых данных — іаіпі сһескѕ 


Механизм, позволяющий Ре! следить за 
перемещением внешних данных в преде 
лах вашей программы и запрещать их ис- 
пользование в системных командах. 


программа — ргортат 
См. сценарий. 


программное обеспечение с открытым 
исходным кодом — ореп 5опгсе зой\уаге 


Программы, для которых можно бесплат- 
но получить исходный код и свободно рас- 
пространять его дальше, без коммерче- 
ских условий. Более точное определение 
можно найти в документе #Ёр://илош.ореп- 
ѕоигсе.ога/оѕа.ћіті. 


продолжение — соп_пиайоп 


Работа с одной или более физическими 
строками как с одной логической стро- 
кой. Строки МайёеШе продолжаются с по- 
мощью обратной косой черты перед симво- 
лом перевода строки. Почтовые заголовки 
по определению ВЕС 822 продолжаются 
с помощью пробела или табуляции после 
перевода строки. В целом для строк Рей не 
требуется какой-либо знак продолжения, 
потому что пробельный символ (в том чис- 
ле символ перевода строки) с радостью иг- 
норируется. Как правило. 
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производный класс — дегіуеа сіаѕв 
Класс, определяющий некоторые из своих 
методов через более общий класс, назы- 
ваемый базовым классом. Обратите вни- 
мание, что классы не разделяются исклю- 
чительно на базовые или производные: 
класс может одновременно функциониро- 
вать как производный и базовый, что, ко- 
нечно, классно. 


пространство имен — пашебрасе 

Домен имен. Нет необходимости беспоко- 
иться, что имена из одного такого домена 
используются в другом. См. пакет. 


протокол — ргофосо1 


В сетевом взаимодействии — согласован- 
ный способ передачи сообщений в обоих 
направлениях, который не должен слиш 
ком смутить ни одного из корреспондентов. 


прототип — ргоќоїуре 


Необязательная часть объявления подпро- 
граммы, сообщающая компилятору Рег], 
сколько и каких аргументов можно пере- 
дать в качестве фактических аргументов, 
чтобы можно было писать вызовы подпро- 
грамм, распознаются анализатором так же, 
как вызовы встроенных функций. (Или не 
распознаются, как может случиться.) 


процедура — ргоседиге 
Подпрограмма. 


процесс — ргосез$ 


Экземпляр выполняющейся программы. 
В многозадачных системах типа ОМХ два 
или более отдельных процесса могут од- 
новременно и независимо выполнять одну 
и ту же программу – на практике для обес- 
печения такой счастливой жизни предна- 
значена функция Гогк. В других операцион- 
ных системах процессы иногда называются 
«ЕЙ геа@з», «базКз», «]065» (потоки, задачи, 
задания), причем различия в названинх 
могут подразумевать небольшие различия 
в значениях. 


псевдолитерал — рзеидоЩега1 


Оператор, похожий на литерал, например 
оператор захвата вывода соттапд. 
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псевдоним — аһаѕ 

Прозвище чего-либо, во всех отношениях 
ведущее себя так же, как если бы вместо 
него использовалось исходное имя. Вре- 
менные псевдонимы неявно создаются 
в переменной цикла для Гогеасй, в перемен- 
ной $ для операторов пар или дгер, в $а и $0 
во время выполнения функции сравнения 
В ѕогї и в каждом элементе @ для факти- 
ческих аргументов вызова подпрограм- 
мы. Постоянные псевдонимы явно созда- 
ются в пакетах путем импортирования 
символов или присваивания переменным 
НурейофБ. Псевдонимы с лексической обла- 
стью видимости для переменных пакетов 
явно создаются объявлением оиг. 


псевдофункция - рзеидоипсИоп 
Конструкция, которая иногда выглядит 
как функция, но в действительности ею не 
является. Обычно относится к модифика- 
торам левосторонних значений, например 
ту, модификаторам контекста, например 
ѕса1аг, и к конструкциям для выбора соб- 
ственных кавычек 4//, 94//, 0х//, 9//, 9г// 
тм/И, 5///, У/И з 1г///. 


псевдохеш — рзеидова$Ь 

Прежде – ссылка на массив, первый эле- 
мент которого содержит ссылку на хеш. 
С псевдохешем можно работать и как со 
ссылкой на массив, и как со ссылкой на 
хеш. Ныне псевдохеши не поддержива- 
ются. 


пустая строка — пи ѕёгіпе 

Строка, не содержащая символов; не пу- 
тать со строкой, содержащей нулевой сим- 
вол, которая имеет положительную длину 
и является истинной. 


пустой контекст — уоій сопіехі 

Вид скалярного контекста, в котором не 
предполагается возврат выражением како- 
го-либо значения, а вычисление его осуще- 
ствляется только ради побочных эффектов. 


пустой список — пи 1$ 


Списочное значение, содержащее ноль эле- 
ментов, представляемое в Рег! как (). 
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путь, маршрут — ра пате 
Полностью квалифицированное имя фай- 


ла, например /иѕг/Біп/регі. Иногда путают 
с РАТН. 


рабочий каталог — могКкіпе бігесіогу 


Текущий каталог, от которого операцион- 
ная система прокладывает относитель- 
ные маршруты. Операционная система 
определяет текущий каталог как тот, ко- 
торый был указан ей посредством коман- 
ды сһдіг, или как то место, в котором на- 
ходился ваш родительский процесс при 
вашем появлении на свет. 


разбиение на лексемы — ф0Кеп1 2115 


Расщепление текста программы на лексе- 
мы. Другое название — «1ех тб». 


разделитель — зерагафог 

Символ или строка, позволяющие разгра- 
ничить две окружающие их строки. С раз- 
делителими работает функция 5р1ії. Не 
путать с ограничителями и терминатора- 
ми. Союз «и» в предыдущем предложении 
был разделителем двух альтернатив. 


разрушать — аез гоу 


Освобождать память объекта ссылки (сна- 
чала вызывая метод ОЕЗТНО\, если он есть). 


разрыв строки — іпеђгеаЕ 


Графема- возврат каретки, за которым 
следует перевод строки, либо любой сим- 
вол со свойством символа Юникода УегИ- 
са] Ѕрасе. 


разыменовывать — дегеѓегепсе 


Причудливый термин вычислительной 
техники, означающий «следовать за ссыл- 
кой к тому, на что она указывает». При- 
ставка «раз-» относится к тому обстоятель- 
ству, что вы удаляете один уровень косвен- 
ности. 


разыменовывающий символ — 
Риппу сһагасёег 


Некто, похожий на Ларри или одного из 
его эксцентричных друзей (иппу сһагас- 
фег- это и «забавный персонаж»). Отно- 
сится также к необычным префиксам, 
которыми Рег! требует помечать свои пере- 
менные-существительные. 
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расширение — ехіепѕіоп 


Модуль Рей, загружающий также ском- 
пилированный код на С или С++. В более 
широком смысле – любая эксперименталь- 
ная возможность, которая интегрируется 
в Регі в результате компиляции; например, 
поддержка многозадачности. 


реализация — іпріетепќабйоп 


То, как фрагмент кода фактически выпол- 
няет свою задачу. Пользователи кода не 
должны полагаться, что детали реализа- 
ции остаются постоянными, если только 
речь не идет об общедоступном интерфейсе. 


регистр — саве 


Свойство некоторых символов. Первона- 
чально наборщики хранили литеры с про- 
писными буквами в верхнем ящике (саѕе), 
а строчные - в нижнем. Юникод распозна- 
ет три регистра: нижний (свойство символа 
\р{10\ег}), заглавный (\р(їіс1е)) и верхний 
(\рќиррег}). Четвертый регистр называется 
сверткой и не является самостоятельным 
регистром, но используется в реализации 
свертки регистра. Не все буквы имеют ре- 
гистр, и некоторые небуквенные символы 
имеют регистр. 


регулярное выражение — 
герщаг ехргеѕѕіоп 


Объект, имеющий несколько интерпрета- 
ций, как слон. Для ученого в области вы: 
числительных наук это грамматика не: 
большого языка, в котором одни строки 
допустимы, а другие - нет. Для обычных 
людей это шаблон, который можно исполь- 
зовать, чтобы найти то, что нужно, если оно 
иногда меняется. Регулярные выражения 
Рей далеки от регулярности в теоретиче- 
ском смысле, но при регулярном примене- 
нии они работают вполне хорошо. Регуляр- 
ное выражение /0һ 3.»{./ соответствует та- 
ким строкам, как "Оһ зау сап уси ѕее Бу ће 
Чамп`$ еаг1у 1191” и "Оһ $14! “. См. главу 5. 


регулярный файл — гершаг ёе 

Файл, не являющийся каталогом, устрой- 
ством, именованным каналом, сокетом 
или символической ссылкой. Рег] иденти- 
фицирует регулярные файлы с помощью 
оператора проверки файла -#. Иногда они 
называются «обычными» (рІаіп) файлами. 
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режим — шоде 

В контексте системного вызова 5482) ука- 
зывает на поле, содержащее биты разре- 
шений и тип файла. 


режим меченых данных -— іаіпі тое 


Включаеся при запуске с ключом -Т, 
обеспечивает маркировку всех внешних 
данных, с целью отследить движение дан- 
ных в программе и воспрепятствовать их 
использованию в системных командах. 
См. главу 20. 


рекурсия — гесиг оп 


Искусство определить что-либо (хотя бы 
частично), ссылаясь на самое себя. В сло- 
варях это порочная практика, но в компь- 
ютерных программах часто работает хоро- 
шо, если следить, чтобы не образовывалась 
бесконечная рекурсия, которая сходна 
с бесконечным циклом, но влечет более 
зрелищный оТказ. 


ретроспективная проверка — ІоокЬеһіпа 


Утверждение, которое заглядывает в стро- 
ку левее текущего найденного соответст- 
вия. 


родительский класс — рагепі с1аѕѕ 
См. базовый класс. 


роль — ге 
Название конкретного набора поведений. 


Роли позволяют расширять поведение 
класса, не прибегая к наследованию. 


самое левое самое длинное — 
1ейбто$1 Іопсеѕі 


Стремление механизма регулярных вы- 
ражений найти самое левое соответствие 
шаблону; затем, исходя из позиции, в ко- 
торой найдено соответствие, стремление 
найти самое длинное соответствие (в пред- 
положении использования жадного кван- 
тификатора). Подробности об этом предме- 
те см. в главе 5. 


самооживление — аџіоуіуіѓбсаііоп 

Греко-романское слово, означающее «ожи- 
вить самого себя». В Ре! адреса хранения 
(левосторонние значения) самопроизволь- 
но создаются по мере необходимости, в том 


числе создаются значения жестких ссы- 
лок, указывающих на следующий уровень 
хранения. Присваивание $а[5][5][5][5][5] = 
“диет” потенциально создает пять адре- 
сов хранения скаляров плюс четыре ссыл- 
ки (в нервых четырех адресах скаляров), 
указывающие на четыре новых аноним- 
ных массива (для хранения четырех по- 
следних адресов скаляров). Но смысл са- 
мооживления в том, что программисту не 
надо об этом беспокоиться. 


сборка мусора — сагђаре соПесііоп 


Неправильно названная функция - ее сле- 
довало назвать «расчет на то, что мать убе- 
рет после вас». Строго говоря, Рег! этого не 
делает, а полагается на механизм подсчета 
ссылок, который приведет все в порядок. 
Однако мы редко выражаемся строго и бу- 
дем часто называть схему подсчета ссылок 
формой уборки мусора. (Может быть, вас 
утешит, что по завершении работы интер- 
претатора запускается «настоящий» сбор- 
щик мусора, который обеспечит уборку, 
если вы неряшливо обращались с цикли- 
ческими ссылками и т.п.) 


свертка регистра — саѕеѓоійіпс 


Используется для сравнения или сопос- 
тавления строк без учета регистра симво- 
лов. В Рей свертка регистра реализуется 
модификатором /1 шаблонов, функцией Ес 
и управляющей последовательностью \Ғ 
в интерполируемых строках. 


свертка регистра — 91 сазе 


Регистр, используемый в Юникоде для 
сравнения или сопоставления без учета 
регистра символов. Сравнение в нижнем, 
заглавном или верхнем регистре не всегда 
дает надежные результаты из-за сложной, 
«один-ко-многим», схемы отображения ре- 
гистров символов в Юникоде. Свертка реги- 
стра – это разновидность нижнего регистра 
(с использованием для некоторых кодов 
символов формы нормализации с декомпо- 
зицией), созданная специально для реше- 
ния этой проблемы. 


свойство — ргорегіу 
См. переменная экземпляра или свойство 
символа. 
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свойство символа — сБагасфег ргорегќу 


Предопределенный класс символов, со- 
ответствующих метазнаку \р или \Р. Для 
Юникода определены сотни стандарт- 
ных свойств для каждого кодового пунк- 
та, а Рег] определяет ряд дополнительных 
свойств. 


связка — Бип е 


Группа взаимосвязанных модулей в СРАМ. 
(Иногда также означает группу ключей 
командной строки, объединенных в один 
кластер ключей.) 


связующий язык — бие Іаприаре 

Язык (например, Рег), который удобен 
для соедивения вместе вещей, изначально 
для соединения не предназначенных. 


связь — Че 

Связь между магической переменной 
и классом ее реализации. См. функцию 
їіе ь главе 27 и главу 14. 


сдвиг влево — Іеѓё зв 


Поразрядный сдвиг, который умножает 
число на некоторую степень двойки. 


сдвиг вправо — гісћіё 5 


Поразрядный сдвиг, который делит число 
на некоторую степень двойки. 


семафор — ѕетарһоге 
Вид блокировки, предотвращающий одно- 
временное использование одних и тех же 
ресурсов несколькими потоками выпол- 
нения или процессами. 


сервер — зегуег 


В сетевом взаимодействии — процесс, пре- 
доставляющий услугу или просто ожидаю- 
щий в известном месте клиентов, которые 
обращаются к нему за услугами. 


сериализация — ѕегіайғаійоп 


Реорганизация сложной структуры дан- 
ных в линейный порядок с целью сохране- 
ния в виде строки в дисковом файле или 
базе данных либо с целью передачи через 
канал. Другое название – маршалинг (таг- 
зраШ пе). 
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сетевой адрес –· пеімогк аййгеѕѕ 


Важнейший атрибут сокета, подобный 
телефонному номеру Обычно ІР-адрес. 
См. также порт. 


сигнал — па! 


Гром среди ясного неба; событие, порож- 
денное операционной системой, когда вы 
меньше всего его ожидали. 


символ — сВагасфег 


Наименыший строительный элемент стро- 
ки. Компьютеры хранят символы как це- 
лые числа, но Рег позволяет работать с ни- 
ми как с текстом. Целое число, представ- 
ляющее символ, нзывается кодом символа. 


символ — ѕутђо! 


В целом любая лексема или метазнак. 
Часто употребляется в более узком смыс- 
ле для обозначения имени, которое можно 
найти в таблице символов. 


символическая ссылка — вутђо!іс Пик 


Альтернативное имя файла, указываю- 
щее на действительное имя файла, кото: 
рое, в свою очередь, указывает на дейст- 
вительный файл. Когда операционная сис- 
тема пытается анализировать маршрут, 
содержащий символическую ссылку, она 
просто подставляет новое имя и продол- 
жает анализ. 


символическая ссылка — 
зушБоНс геѓегепсе 


Переменная, значением которой является 
имя другой переменной или подпрограм- 
мы. Путем разыменования первой пере- 
менной можно получить вторую. Символи- 
ческие ссылки недопустимы при использо- 
вании директивы и5е ѕігісї "геғѕ”. 


символический отладчик — 
зушБоЦс аеБиврег 


Программа, позволяющая выполнять дру- 
гую программу в пошаговом режиме, вре- 
мя от времени останавливаясь и выводя 
данные, чтобы посмотреть. не пошле ли 
что-нибудь не так, и если да, то что. Слово 
«символический» означает, что с отладчи- 
ком можно разговаривать, используя те же 
символы, с которыми была написана ваша 
программа. 
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синтаксис — ѕупіах 


От греческого «суута&іс». Порядок, в соот- 
ветствии с которым вещи (в особенности 
символы) располагаются совместно. 


синтаксический анализ — рагѕіпе 


Тонкое, но иногда жестокое искусство пре- 
образования вашей, возможно, плохо сфор- 
мированной программы в допустимое син- 
таксическое дерево. 


синтаксический сахар — ѕупќасііс зираг 


Альтернативный способ более простого на- 
писания; сокращение. 


синтаксическое дерево — зущах їгее 


Внутреннее представление программы, 
при котором конструкции более низкого 
уровня свисают из заключающих их кон- 
струкций более высокого уровня. 


синхронный — ѕупсһгопоиѕ 


Способ программирования, когда события 
определяются как организованная последо- 
вательность; т.е. когда события происходят 
одно за другим, а не в одно и то же время. 


системный вызов — ѕвуѕса] 


Вызов функции, непосредственно обра- 
щенный к операционной системе. Многие 
важные подпрограммы и функции, кото- 
рые мы используем, не являются непосред- 
стненными системными вызовами, но сто- 
ят на один или несколько уровней выше, 
чем системные вызовы. В целом, програм- 
мистам Регі не нужно беспокоиться об этих 
различиях. Однако человек, знающий, ка- 
кие из функций Рег! в действительности 
являются системными вызовами, сможет 
предсказать, какая из них установит пере- 
менную $! ($ЕВАМ№) в случае отказа. К сожа- 
лению, начинающие программисты часто 
ошибочно называют «системным вызо- 
вом» вызов функции зузтет, которая фак- 
тически выполняет множество системных 
вызовов. Чтобы избежать путаницы, мы 
почти всегда говорим «системный вызов», 
когда имеется в виду то, что можно косвен- 
но вызвать через функцию ѕуѕса11, и нико- 
гда в отношении того, что следует вызы- 
вать функцией ѕуѕїеп. 


скаляр — зсайаг 


Простое отдельное значение; число, стро- 
ка или ссылка. 


скалярная переменная — ѕсаіаг уааЫе 


Переменная с префиксом $. содержащая 
одно значение. 


скалярное значение — вса]аг уаше 


Значение, являющееся скаляром (ср. спи- 
сок). 


скалярныи контекст — ѕсајаг сопѓехё 


Ситуация, когда окружение (вызывающий 
код) ожидает, что выражение вернет един- 
ственное значение, а не список. См. также 
контекст и списочный контекст. Ска- 
лярный контекст иногда накладывает до- 
полнительные ограничения на возвращае- 
мое значение — см. строковый контекст 
и числовой контекст. Иногда мы говорим 
о булевом контексте внутри условных 
операторов, но он не накладывает допол- 
нительных ограничений, потому что лю- 
бое скалярное значение, число или строка 
уже явлнется истинным или ложным. 


скалярный литерал — ѕсајаг Ніега1 


Число или строка в кавычках – факти- 
ческое значение в программе (ср. перемен- 
ная). 


слабая ссылка — меаК гейегепсе 


Ссылка, не учитываемая механизмом под- 
счета ссылок. Когда исчезает последняя 
нормальная ссылка на данные, они ути- 
лизируются сборщиком мусора. Слабые 
ссылки могут использоваться для созда- 
ния циклических ссылок, не препятствую- 
щихутилизации ненужных данных, как 
нормальные ссылки. 


слово — мога 


На обычном компьютерном языке – фраг- 
мент данных такого размера, который 
наиболее эффективно обрабатывается ком- 
пьютером, обычно 32 бита плюс-минус не- 
сколько степеней двойки. В культуре Рей 
чаще относится к буквенно-цифровому 
идентификатору (включая символы под- 
черкивания) или к строке символов, отлич- 
ных от пробельных, ограниченной по кра- 
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ям пробельными символами или границей 
строки. 


смертник — тогіѓа] 


Временное значение, которое должно уме- 
реть, когда закончится текущая команда. 


смещение — о её 


Количество элементов, которое следует 
пропустить, перемещаясь от начала строки 
или массива в заданную позицию. Поэтому 
минимальное смещение равно нулю, а не 
единице, поскольку не надо ничего пропус- 
кать, чтобы добраться до первого элемента. 


соединение — соппесііоп 


В телефонии это создание временной элек- 
трической цепи между аппаратами вызы- 
вающего и вызываемого абонентов. В сете- 
вом взаимодействии это такая же времен- 
ная цепь между клиентом и сервером. 


сокет — зосКеё 


Конечная точка сетевого соединения меж- 
ду несколькими процессами, которая дей- 
ствует во многом сходно с телефонной ка- 
бинкой или почтовым ящиком. Самое важ- 
ное в сокете – его сетевой адрес (как номер 
телефона). Различные виды сокетов имеют 
различные виды адресов: некоторые похо- 
жи на телефонные номера, а некоторые — 
нет. 


соответствие — таісһіпе 
См. поиск по шаблону. 


сортирующая последовательность — 
соПайпе зедиепсе 

Порядок, согласно которому сортируют- 
ся символы. Им руководствуются, напри- 
мер, программы сортировки строк, решая, 
в какое место данного глоссария поместить 
«порядок сравнения». 


состояние гонки — гасе соп9 йоп 


Состояние гонки возникает, когда резуль- 
тат не связанных между собой событий 
зависит от порядка, в котором они насту- 
пают, но этот порядок невозможно гаран- 
тировать из-за недетерминированности 
временных эффектов. Если две или более 
программ или частей одной программы 


пытаются пройти через ту же самую серию 
событий, одна можех прервать работу дру- 
гой. Это можно использовать для поиска 
уязвимостей и создания эксплойтов. 


со-хранитель -— со-тайцатег 


Человек, обладающий правом индексиро- 
вать пространство имен в РАОЅЕ. Любой 
может выгружать исходные тексты в лю- 
бое пространство имен, но только основ- 
ной хранитель и со-хранители могут вно- 
сить свой вклад, доступный для индекси- 
рования. 


СПИСОК – И$Т 


Синтаксическая конструкция, представ- 
ляющая разделенный запятыми список 
выражений, производящих при вычисие- 
нии списочное значение. Каждое выраже- 
ние в /15Т вычисляется в списочном кон- 
тексте и интерполируется в списочное 
значение. 


список — іѕё 


Упорядоченное множество скалярных зна- 
чений. 


списочное значение — 1154 уаше 


Безымянный список временных скаляр- 
ных величин, который может передавать- 
ся в программе от любой функции, генери- 
рующей список, любой функции или кон- 
струкции, предоставляющей списочный 
контекст. 


списочный контекст — 115% сотбехё 


Ситуация, когда окружение (вызываю- 
щий код) ожидает, что выражение вернет 
список значений, а не отдельное значение. 
Функции, которым требуется список аргу- 
ментов, сообщают этим аргументам, что 
они должны создать списочное значение. 
См. также контекст. 


списочный оператор — 115% орегафог 


Оператор, делающий что-то со списком 
значений, например јоіп или дгер. Обыч- 
но используется для именованных встро- 
енных операторов (таких как ргіпї, ип пк 
и ѕуѕїеп), в которых список аргументов 
можно не заключать в круглые скобки. 
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среда — епуігоптепё 


Совокупность переменных среды, унасле- 
дованвых процессом от родителя. Доступ 
осуществляется через %ЕМ\. 


срез — $ісе 
Произвольное число элементов. отобран- 
ных из списка, массива или хеша. 


ссылка — геѓегепсе 


Место, где находится указатель на инфор- 
мацию, хранящуюся где-то еще. (См. кос 
венность.) Ссылки бывают двух видов: 
символические ссылки и жесткие ссылки. 


ссылка; компоновать — ПпК 


При использовании в качестве существи- 
тельного – имя в каталоге, представляю- 
щее файл. На заданный файл может быть 
несколько ссылок. Это похоже на вклю- 
чение в телефонный справочник одного 
и того же номера телефона под разными 
именами. В качестве глагола означает раз- 
решение неразрешенных символов частич- 
но скомпилированного файла в (почти) вы- 
полняемый образ. Компоновка может быть 
статической или динамической, что не 
имеет никакого отношения к статической 
или динамической области видимости. 


ссылка на найденный текст — 
БасКкгеѓегепсе 


Подстрока, захваченная подшаблоном 
в простых скобках в регулярном выраже- 
нии. Десятичные числа с обратной косой 
чертой перед ними (\1, \2 ит.д.) в том же 
шаблоне ссылаются на соответствующий 
подшаблон в текущем поиске. Вне шабло- 
на нумерованные переменные ($1, $2 ит.д.) 
продолжают ссылаться на те же значения, 
пока этот шаблон является последним ус- 
пешно сопоставленным шаблоном в теку- 
щей динамической области видимости. 


стандартная библиотека — 
Ѕіапдага ГФгагу 


Все, что распространяется в официальном 
дистрибутиве регі. Некоторые производи- 
тели собирают свои версии регі, изменяя 
состав дистрибутива, исключая какие-то 
элементы или включая дополнительные. 
См. также двойная жизнь. 


стандартное устройство ввода — 
5{апдага іприё 


Входной поток данных программы по 
умолчанию, который, если это возможно, 
не должен обращать внимания на то, отку- 
да посгупают данные. Представлен в про- 
грамме на Ре] дескриптором файла 5Т01М. 


стандартное устройство вывода — 
5фапдага оибриё 


Выходной поток данных программы по 
умолчанию, который, если это возможно, 
не должен обращать внимания на то, куда 
отправляются данные. Представлен в про- 
грамме на Рег] дескриптором файла ЗТОО\Т. 


стандартное устройство ошибок — 
ѕќапдага еггог 


Стандартный выходной поток данных для 
неприятных замечаний, которые не следу- 
ет записывать в стандартное устройство 
вывода. В программе на Рег| представлен 
дескриптором файла УЭТОЕВВ. Можно яв- 
но использовать этот поток, а встроенные 
функции Піе и магп пишут в стандартное 
устройство вывода ошибок автоматически 
(если вывод не перехватывается и не обра- 
батывается каким-то иным способом). 


стандартный — 5фапдага 


Включенный в официальный дистрибутив 
Рег: стандартный модуль, стандартное 
инструментальное средство, стандартная 
страница руководства Регі. 


стандартный ввод/вывод — ѕїапдага 1/0 


Стандартная библиотека С для осуществле- 
ния буферизованного ввода и вывода в опе 
рационную систему. («Стандарт» стандарт- 
ного ввода/вывода лишь частичнс связан 
со «стандартами» стандартных устройств 
ввода/вывода.) В целом Ре! полагается на 
реализацию стандартного ввода/вывода, 
предоставляемую операционной системой, 
поэтому характеристики буферизации 
программы Рег! на одной машине могут 
не вполне совпадать с подобными характе- 
ристиками на другой машине. Обычно это 
влияет только на эффективность, а не на 
семантику. Если ваш пакет стандартного 
ввода/вывода осуществляет только блоч- 
ную буферизацию, а вам нужно очищать 
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буфер чаще. установите переменную $| 
в истинное значение. 


статическая облаеть видимости — 

Бќайс всорште 

Не поддерживается. См. лексическая об- 
ласть видимости. 


статическая переменная — ѕїаііс уагіаЫе 


Не поддерживается. Используйте лекси- 
ческую переменную в области видимости, 
большей, чем ваша подпрограмма, или 
объяните ее с помощью ключевого слова 
ѕтаїе вместо пу. 


статический — ѕїаііс 


Медленно меняющийся относительно че“ 
го-то другого. (К сожалению, все являет- 
ся относительно стабильным в сравнении 
с чем-то еще, за исключением некоторых 
элементарных частиц, в отношении кото- 
рых нельзя говорить уверенно.) В компью- 
терах, где все должно изменяться быстро, 
термин «статический» имеет презритель- 
ный оттенок, указывая на не вполне функ- 
циональные переменную, подпрограмму 
или метод. В культуре Рей этого слова 
вежливо избегают. 


статический метод — айс теіһоа 
Не поддерживается. См. метод класса. 


статус — ѕіаёцѕ 


Значение, возвращаемое родительскому 
процессу, когда один из порожденных им 
процессов завершается. Это значение по- 
мещается в специальную переменную $2. 
Старшие восемь разрядов содержат код 
завершения процесса, а младшие восемь 
определяют сигнал (если он был), завер- 
шивший процесс. В системах ОМІХ это 
значение статуса совпадает со словом ста- 
туса, возвращаемым шайк(2). См. ѕуѕтет 
в главе 27. 


статус завершения — ехії ѕзќаёиѕ 
См. статус. 


стек — зфасК 

Устройство, на вершину которого можно 
что-то помещать, а затем извлекать в об- 
ратном порядке. См. ІРО. 
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страница руководства — тапраре 

«Страница» из руководства, доступ к ко- 
торой обычно осуществляется через ко- 
манду тап(1). Страница руководства со- 
держит разделы БУМОРЯ!$ (аннотация). 
РЕЗСКІРТІОМ (описание), ВОС (список 
известных ошибок) ит.д. и обычно длиннее 
печатной страницы. Страницы руководст- 
ва документируют команды, системные 
вызовы, библиотечные функции, устрой- 
ства, протоколы, файлы и т.п. В данной 
книге мы называем страницей руководст- 
ва любую часть стандартной документа- 
ции Рег| (например, регіор или рей4ейа), 
независимо от того, в каком формате она 
установлена в конкретной системе. 


строка — ѕігіпе 

Последовательность символов, такая как 
«Она сказала !@#*6%@#*1ь. Строка не 
обязательно должна быть полностью печа- 
таемой. 


строковый контекст -- ѕігіпє сопёехі 


Ситуация, когда окружение (вызывающий 
код) ожидает, что выражение вернет стро- 
ку. См. также контекст и числовой кон- 
текст. 


строчка — Ппе 

В ОМІХ это последовательность из нуля 
или более символов, отличных от перевода 
строки, завершающаяся символом перево- 
да строки. На прочих платформах строки 
эмулируются библиотекой С, даже если 
операционная система имеет иные пред- 
ставления. 


структура — ѕёгисёџге 
См, структура данных. 


структура 562 — ѕіаі ѕіғисёџге 


Особое место в памяти Ре], где хранятся 
данные о последнем файле, сведения о ко- 
тором запрашивались. 


структура данных — даќа ѕігисіџге 


Способ объединения отдельных элементов 
данных, а также форма, которую данные 
совокупно образуют, — прямоугольная таб- 
лица или треугольное дерево. 
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суперпользователь — зпрегизег 

Лицо, которому операционная система 
позволяет делать почти все. Обычно это 
ваш системный администратор или некто, 
претендующий на роль системного адми- 
нистратора. В системах ОМХ это пользо- 
ватель гооё. В системах Ұіпіоуѕ это обыч- 
но пользователь Айтіпіѕігаіог. 


сценарий — ѕегірі 

Текстовый файл, являющийся програм- 
мой, предназначенной для непосредствен- 
ного выполнения, а не компиляции в файл 
другого вида перед выполнением. 


Кроме того, в контексте Юникода означает 
систему письменности языка или группы 
языков, например греческого, бенгальско- 
го или Тепя\гаг. 


таблица символов — ѕутђо! іађе 


Место, где компилятор запоминает сим- 
волы. Программа типа Рег должна ка- 
ким-то образом запоминать все имена всех 
переменных, дескрипторов файлов и под- 
программ, которые были использованы. 
Она делает это, помещая имена в таблицу 
символов, которая реализована Рег] с по- 
мощью хеш-таблицы. В каждом пакете 
присутствует собственная таблица симво- 
лов, предоставляющая каждому пакету 
собственное пространство имен. 


текст — іехіё 


Строка или файл, содержащие в основном 
печатаемые символы. 


текущий выбранный канал вывода — 
сиггепЙу ѕеіесіед оцёриё сһаппе! 


Последний дескриптор файла, назначен- 
ный с помощью эе1ес((ЕТЬЕНАМОЕЕ); ЗТОООТ, 
если не был выбран какой-либо дескрип- 
тор файла. 


текущий пакет — сигтепі раскаре 


Пакет, в котором скомпилирована теку- 
щая команда. Ищите в обратном направ- 
лении в тексте программы, в текущей 
лексической области видимости или в ох- 
ватывающих лексических областях, пока 
не найдете объявление пакета. Это и будет 
именем текущего пакета. 


текущий рабочий каталог — 
сиггепі могКкіпр дігесіогу 


См. рабочий каталог. 


тема — оріс 

То, над чем вы работаете. Конструкции, 
такие как мһі1е(<>), Гог, ѓогеасћ и дімеп, оп- 
ределяют тему, по умолчанию присваивая 
значение переменной $ . 


терм — {егт 

От «терминальный», т.е. лист синтаксиче- 
ского дерева. То, что грамматически слу- 
жит операндом для операторов выражения. 


терминатор — ѓегліпаѓог 


Символ или строка, помечающие конец 
другой строки. Переменная $/ содержит 
строку, завершающую операцию геад1пте, 
которую сһопр удаляет из конца строки. Не 
путать с ограничителями и разделителя- 
ми. Точка в конце этогс предложения яв- 
ляется терминатором. 


тернарный — фегпагу 


Оператор, принимающий три операнда. 
Иногда произносится ѓгіпагу (тринарный). 


тест пустого подкласса — 
етрёу зи а55 іеѕё 


Означает, что пустой производный класс 
должен вести себя, в точности как его ба 
зовый класс. 


тип — буре 
См. тип данных и класс. 


тип данных — даа фуре 


Множество допустимых значений, а так- 
же операции, умеющие обращаться с эти- 
ми значениями. Например, для числового 
типа данных существует некое множество 
чисел, с которыми можно работать, а так- 
же различные математические операции, 
которые можно производить с числами, но 
которые не очень осмысленны, скажем, со 
строками. Для строк есть свои операции, 
например конкатенация. А для составных 
типов, образованных из некоторого коли- 
чества меньших частей, обычно существу- 
ют операции образования и декомпозиции, 
а возможно, и реорганизации. Объекты, 
моделирующие предметы реального мира, 
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часто имеют операции, соответствующие 
их реальной демтельности. Например, ес- 
ли моделируется лифт, объект лифта дол- 
жен иметь метод открыть_дверь(). 


типизованная лексическая 
переменная — уреа 1ех1са1 
Лексическая переменная, 
с типом класса: ту Ропу $0111. 


объявленная 


транслитерировать — ігапзілќегаќе 


Преобразовывать одно представление стро- 
ки в другое путем отображения каждого 
символа исходной сгроки в соответствую- 
щий символ результирующей строки. Не 
путайте с трансляцией (переводом), напри- 
мер греческое слово ло\оуроџос транслите- 
рируется в ройусйготоз, но переводится как 
многоцветный. См. оператор 1г/// в главе 5. 


триггер — и ебег 
Событие, которое вызывает запуск обра- 
ботчика. 


троичный — ігіпагу 
Не система из трех звезд, а оператор, при- 


нимающий три операнда. Иногда пишется 
{егпагу (тернарный). 


тупоконечник (прямой порядок 
следования байтов) — Ыр-еп@ап 

Из Свифта: тот, кто разбивает яйцо с тупо- 
го конца. Употребляется также в отноше- 
нии компьютеров, в которых старший байт 
слова хранится в младшем адресе, а млад- 
ший в старшем. Часто считается, что та- 
кие компьютеры превосходят «остроконеч- 
ные» машины. См. также остроконечник 
(обратный порядок следования байтов). 


тыква — ритркіп 

Условный «жезл», ходящий в сообществе 
Рег], которым владеет ведущий интегра- 
тор в какой-либо области разработок. 


уборка — геаршя 

Последний ритуал, исполняемый роди- 
тельским процессом в отношении почив- 
шего процесса-потомка, чтобы тот не пре- 
вратился в зомби. См. вызовы функций 
маіт и маіїріа. 
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указатель — деѕсгіріог 
См. указатель файла. 


указатель — роіпіег 

Переменная в языке типа С, содержащая 
точный адрес другого элемента в памяти. 
Рег! обрабатывает указатели самостоя- 
тельно, и о них беспокоиться не следует. 
Вместо указателей используются симво- 
лические указатели в виде ключей и имен 
переменных пибо жесткие ссылки, кото- 
рые указателями не являются (но действу- 
ют как указатели и фактически содержат 
в себе указатели). 


указатель файла — Ше дезсгирфог 
Маленькое число, используемое операци 
онной системой для слежения за откры- 
тыми файлами. Рег! скрывает указатель 
файла внутри потока стандартного ввода/ 
вывода, а затем прикрепляет поток к деск- 
риптору файла. 


унарный оператор — ипагу орегафог 
Оператор с единственным операндом, та- 
кой как ! или сһоіг. Унарные операторы 
обычно являются префиксными, т.е. они 
предшествуют своему операнду. Операто- 
ры ++ и -- могут быть префиксными или 
постфиксными. (Их положение изменяет 
их смысл.) 


усечение — фгипсайп8 

Удаление из файла его содержимого — ав- 
томатически при открытии файла для 
записи или явным образом, посредством 
функции ігипсаїе. 


условный оператор — сопӣібіопаі 


Нечто сомнительное («1{Фу»). См. булев кон- 
текст. 


услуга — ѕегуісе 

Нечто, что мы выполняем для кого-то дру- 
гого, чтобы удовлетворить его, например 
сообщаем ему время суток (или время, ко- 
торое ему осталось). На некоторых маши- 
нах перечень доступных услуг можно по- 
лучить вызовом функции де{зегуепт. 


устройство — дем1се 
Аппаратная штуковина (типа диска, лен- 
точного устройства. джойстика или мы- 
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ши), встроенная в компьютер, которую 
операционная система пытается заста- 
вить выглядеть как файл (или группа фай- 
лов). В ОМІХ эти ложные файлы обычно 
живут в каталоге /4еи. 


утверждение -— аѕѕегііоп 


Составляющая регулярного выражения, 
которая должна быть истинной в случае 
соответствия шаблону, но не обязатель- 
но должна сама соответствовать каким-то 
символам. Часто используется в специа- 
лизированном значении утверждения ну- 
левой ширины. 


фаза выполнения — гип рһаѕе 


Любой момент времени после того, как 
Рей запустич нашу основную программу. 
См. также фаза компиляции. Фаза выпол- 
нения в основном проходит на этапе вы- 
полнения (гипите), но может также прохо- 
дить на этапе компиляции (сотріїе инте), 
когда выполняются операторы гедиіге, 00 
ЕПЕ или еуа1 5ТИТМС, либо когда подстанов- 
ка использует модификатор /ее. 


фаза компиляции — сошрИе рћаѕе 


Любой момент времени перед тем, как Рей 
начинает выполнять вашу основную про- 
грамму. См. также фаза выполнения. Фа- 
за компиляции в основном приходится на 
этап компиляции, но может также иметь 
место на этапе выполнения, когда вычис- 
ляются блоки ВЕСЛ\, объявления џѕе или 
подвыражения констант. Код начального 
запуска и код импорта любого объявления 
изе также выполняется в фазе компиляции. 


файл — Ше 

Именованная совокупность данных, обыч- 
но сохраненная на диске, в каталоге фай 
ловой системы. Примерно соответствует 
документу, если использовать канцеляр- 
ские метафоры. В современных файловых 
системах файл может иметь несколько 
имен. Некоторые файлы, например ката- 
логи и устройства, обладают особыми свой- 
ствами. 


файловая система — Шезузвет 


Набор каталогов и файлов, находящихся 
на разделе диска. Иногда называется «раз- 
делом» (раг оп) диска. Можно изменять 


имена файлов и даже перемещать файлы 
из каталога в каталог в пределах файловой 
системы без фактического перемещения 
самого файла, по крайней мере в системах 
омх. 


фактические аргументы — 
асфта! агбготепе5 


Скалярные значения, передаваемые функ- 
ции или подпрограмме при их вызове. На- 
пример. при вызове ромег("риғғ") строка 
“ри! Р° представляет собой фактический 
аргумент. См. также аргумент и формаль- 
ныє аргументы. 


фатальная ошибка -- баба] еггог 


Неперехваченное исключение, вызываю- 
щее завершение процесса после вывода со- 
общения в стандартный поток ошибок. 
Ошибки, возникающие внутри еха1, не 
являются фатальными. Завершение еуа1 
происходит после того, как сообщение об 
исключении будет записано в переменную 
$@ (ФЕМАЕ_ЕВВОВ). Можно попытаться спро- 
воцировать фатальную ошибку посредст- 
вом оператора біе (который возбуждает ис- 
ключение), но она может быть перехвачена 
динамически охватывающим е\а1. В от- 
сутствие перехвата 01е становится фаталь- 
ной ошибкой. 


фильтр — ЯНег 


Программа, предназначенная для преоб- 
разования потока ввода в поток вывода. 


фильтр ввода/вывода – 1/0 Іауег 

Один из фильтров между исходными дан- 
ными и тем, что получится на входе или на 
выходе. 


фильтр исходного кода — ѕоигсе ЯЦег 

Модуль особого типа, осуществляющий 
препроцессинг нашего сценария перед тем, 
как он попадет в лексический анализатор. 


флаг — Пає 

Мы стараемся избегать этого термина вви- 
ду его многозначности. Он может означать 
ключ командной строки, который сам не 
принимает аргументов (например, фла- 
ги Рег! -п и -р), или реже индикаторный 
разряд (например, флаги 0_СВЕАТ и 0 ЕХСЬ 
в зузореп). 


Глоссарий 
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формальные аргументы — 
Гогта1 агӯештепіѕ 


Общие имена, под которыми подпрограмме 
известны ее аргументы. Во многих языках 
формальным аргументом всегда даются 
личные имена, но в Рег| формальные аргу- 
менты просто являются элементами масси- 
ва. Формальными аргументами в програм- 
ме Рей являются ФАНСУГО], ФАВСУ[1] и т.д. 
Аналогично формальными аргументами 
в подпрограмме Рей являются $ [0], $_[1] 
и т.д. Аргументам можно дать отдельные 
имена, присвоив их значения списку пу. 
См. также фактические аргументы. 


формат — Ѓогтаі 


Указывает, сколько и куда помещать про- 
белов, цифр и прочего, чтобы все, что вы- 
водится, выглядело аккуратно и красиво. 


формирователь — сошрозег 


«Конструктор» для объекта ссылки, кото- 
рый в действительности не является объек- 
том, например, анонимного массива или 
хеша. Например, пара фигурных скобок 
действует как формирователь хеша, а пара 
квадратных скобок действует как форми- 
рователь для массива. См. раздел «Созда- 
ние ссылок» в главе 8. 


функция — шпеНоп 


В терминах математики — отображение на- 
бора исходных значений в набор конечных 
значений. В компьютерах указывает на 
подпрограмму или оператор, возвращаю- 
щие значение. Такая функция может и не 
иметь исходных значений (называемых ар- 
гументами). 


хакер -— ВасКег 


Некто, проявляющий поразительную на- 
стойчивость в решении технических про- 
блем, будь то игра в гольф, сражение с ор- 
ками или программирование. Хакер яв- 
ляется нейтральным термином в смысле 
морали. Добрых хакеров не нужно путать 
со злыми взломщиками или невежествен- 
ными ѕсгірі ма ез. Если вы их путаете, 
мы должны предположить, что вы злы 
или невежественны. 


хеш — ћҺаѕһ 


Неупорядоченное объединение пар ключ/ 
значение, позволяющее использовать стро- 
ку ключ для поиска связанного с ней зна- 
чения данных. Этот глоссарий подобен хе- 
шу, в котором определяемое слово служит 
ключом, а определение является значени- 
ем. Иногда хеш называют «ассоциативным 
массивом», и длина этого названия служит 
достаточным основанием предпочесть сло- 
во «хеш». 


хеш-таблица — ћһаѕһ фае 


Структура данных, используемая Ре! для 
эффективной реализации ассоциативных 
массивов (хешей). См. также блок — бисКеі. 


хост — ћоѕі 


Компьютер, на котором располагается про- 
трамма или другие данные. 


целое число — іпќевег 


Число без дробной (десятичной) части. Чис- 
ла по порядку, например 1, 2, З и т.д., но 
вместе с числом 0 и отрицательными чис- 
лами. 


цикл — І0ор 


Конструкция, котора» делает что-либо мно- 
гократно, как американские горки. 


ЧАВО – ЕАО 


ЕгедиепИу АѕКкеа Соебііопр — часто задавае- 
мые вопросы (не обязательно с часто полу- 
чаемыми ответами, особенно если ответ 
есть в Рег! КАФ, входящем в стандартную 
поставку Регі). 


числовой контекст — питегіс сопіехі 


Ситуация, в которой окружение (вызываю- 
щий код) предполагает, что выражение 
возвращает число. См. также контекст 
и строковый контекст. 


читаемый — геадаЫе 


Применительно к файлу означает, что 
установлен бит разрешений, позволяю- 
щий обращаться к файлу. Применительно 
к программе означает, что она написана 
достаточно хорошо, чтобы можно было ра- 
зобраться в ее устройстве. 
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члены-данные — тетбег даа 
См. переменная экземпляра. 


шаблон — раќегп 
Структура, используемая при поиске пс 
шаблону. 


шаблон этапа выполнения — 
гипііпе раёќегп 


Шаблон, содержащий одну или более пе- 
ременных, которые должны быть интерпо- 
лированы до разбора шаблона как регуляр- 
ного выражения, который поэтому нельзя 
анализировать на этапе компиляции, но 
следует заново анализировать при каждом 
выполнении оператора поиска по шаблону. 
Шаблоны этапа выполнения полезны, но 
дороги. 


шестнадцатеричный — һехайесітаі 


Число по основанию 16, «Пех». Числа от 10 
до 16 обычно представляются буквами ота 
до Ё Шестнадцатеричные константы в Ре 
начинаются с 0х. См. также функцию һех 
в главе 27. 


широковещание — Ъгоайсаѕё 


Отправка датаграммы сразу по несколь- 
ким адресам. 


экземпляр — 11154 апсе 


Сокращенно от «экземпляр класса», что 
означает объект класса. 


эклектичный — есіесііс 


Порожденный многими источниками. Не- 
которые скажут, что слишком многими. 


эксплоит, уязвимость — ехрой 

В данном случае это слово используется 
как существительное. Оно обозначает из- 
вестный способ скомпрометировать про- 
грамму и заставить ее выполнить дейст- 
вия, не предусмотренные автором. Ваша 
задача в том, чтобы писать программы, не 
допускающие такой возможности. 


экспорт, экспортировать — ехрогі 


Сделать символы модуля доступными для 
импорта другими модулями. 
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элемент — еіетепі 


Основной строительный элемент. Если го- 
ворить о массиве, элемент — это один из 
предметов, из которых состоит массив. 


этап выполнения — гипііте 


Время, когда Рег| фактически выполняет 
то, что сказано в нашем коде, в противопо- 
ложность предшествующему периоду, эта- 
пу компиляции, когда Рег| пытался выяс- 
нить, есть ли вообще смысл в том, что мы 
сказали. 


этап компиляции — сошрИе Ите 


Этап, на котором Рег! пытается осмыс- 
лить ваш код, в противоположность тому 
времени (этап выполнения), когда ему ка- 
жется, что он знает, каков смысл вашего 
кода, и просто пытается сделать то, что, 
по его мнению, ваш код хочет, чтобы было 
сделано. 


Юникод — Ошсо4е 


Набор символов, включающий практиче- 
ски все значимые наборы символов на све- 
те. См. РИр://шри итсоде.ога. 


является — іѕ-а 

Разновидность связи между двумя объек- 
тами, когда один объект рассматривается 
как более специфическая версия друго 
го, родового объекта: «верблюд относится 
к млекопитающим». Поскольку родовой 
объекг в действительности существует 
только в платоническом смысле, мь обыч- 
но добавляем долю абстракции к поня- 
тию объектов и представляем связь как 
существующую между родовым базовым 
классом и специфическим производным 
классом. Как ни странно, у платонических 
классов связи бывают не только платони- 
ческими – см. наследование. 
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Ѕ$утБоіѕ 
`(поразрядное ИСКЛЮЧАЮЩЕЕ ИЛИ), 
оператор, 138 
_ (подчеркивание), специальный дескриптор 
файла, 729 
- (вычитание), оператор, 126 
-, команда отладчика, 584 
-> (стрелка), оператор, 121, 351, 418 
-- (автодекремент), оператор, 122 
—, ключ командной строки, 557 
‚ (запятая), оператор, 146 
; (точка с запятой) 
в простых операзорах, 150 
приемы программирования, 647 
п, разделитель имен пакетов, 87 
!!, команда отладчика, 585 
|= (не равно), оператор, 59, 132 
?:, условный оператор, 142 
„, команда отладчика, 581 
.. (диапазон), оператор, 140 
„.. (многоточие), оператор, 171 
‘(одиночные кавычки), 37 
"(двойные кавычки), 37 
() (круглые скобки), 120, 188, 648 
О (квадратные скобки) 
индексы массивов, 39 
символьные классы, 219 
формирование анонимных массивов, 344 
{, команда отладчика, 585 
{{, команда отладчика, 585 
{} Фигурные скобки) 
и символические ссылки, 360 
приемы программирования, 647 
формирование анонимных хешей, 345 
@ (коммерческое ай), разыменовывающий 
префикс, 85 
@ , переменная, 728 
приемы программирования, 673 
* (звездочка), символ, 36 
* (умножение), оператор, 54, 125 
** (возведение в степень), оператор, 54, 123 
/ (деление), оператор, 125 
// (логическое определенное ИЛИ), оператор, 
139 
\ (обратная косая черта), оператор, 844, 353 


экранированные символы с обратной 
косой чертой, 93 
& (амперсанд), символ, 86 
& (поразрядное И), оператор, 188 
&& (логическое И), оператор, 139 
#, символ (комментарии), 81 
% (знак процента), символ, 36 
оператор деления по модулю, 54, 125 
разыменовывающий префикс, 85 
%-, переменная, 730 
+ (плюс), оператор сложения, 54, 126 
++ (автоинкремент), оператор, 122 
<, команда отладчика, 585 
< (меньше), оператор, 59, 182 
<= (меньше или равно), оператор, 59, 132 
<< (сдвиг влево), оператор, 127 
<< синтаксис встроенных документов, 98 
<=> (сравнение), оператор, 59, 132 
=, команда отладчика, 586 
=, конструктор копирования, 456 
=>, оператор стрелки, 413 
и пары ключ/значение, 108 
приемы программирования, 671 
== (равно), оператор, 59, 182 
=- (связывание), оператор, 124 
>= (больше или равно), оператор, 59, 132 
> (больше), оператор, 59, 182 
>, команда отладчика, 585 
>> (сдвиг вправо), оператор, 127 
| (вертикальная черта), 188 
| поразрядное ИЛИ), оператор, 138 
| стогическое ИЛИ), оператор, 139 
- {поразрядное НЕ), оператор, 138 
—- (интеллектуальное сопоставление), 
оператор, 132, 156 
$ (знак доллара), символ, 36 
метасимвол в регулярных выражениях, 
233 
разыменовывающий префикс, 84 
$`, переменная 
приемы программирования, 677 
$_, переменная 
волшебное изгнание, 470 
и автоматическое присваивание значе- 
ний, 112 
описание, 728 
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приемы программирования. 672 
$[, переменная, 729 
$], переменная, 729 
$*, переменная, 729 
$4, переменная, 729 


А 
а, команда отладчика, 584 
А, команда отладчика, 585 
-а, ключ командной строки, 557, 931 
-А, оператор проверки файлов, 130 
/а, модификатор, 193, 200. 203 
\А, метасимвол, 282 
\а, экранированная последовательность, 93, 
218 
\А, экранированная последовательность, 213 
Фа, переменная, 730 
абѕ, функция, 447, 779 
ассерї, функция, 779 
$АССОМОБАТОВ ($^А), переменная, 730 
„а], расширение файлов, 932 
ајаг, функция, 504, 779 
апит, класс символов, 226 
а1рва, класс символов, 226 
АпурВМ _Ейе, модуль, 463, 691 
АпуЕуепі, модуль, 663 
ФАРВСУ, переменная, 114, 730 
@АКСУ, переменная, 114, 730 
АКСУ, дескриптор файла, 730 
АВСУ, массив, 975 
АВСУОСТ, дескриптор файла, 730 
азсП, класс символов, 226 
аќап2, функция, 780 
айг1Ьщез, прагма 
веі, функция, 935 
гейуре, функция, 418, 869, 935 
и подпрограммы, 339 
описание, 935 
аи огз (каталог СРАМ), 601 
аифофох, прагма, 653 
аџѓоаіе, прагма, 652, 656, 936 
приемы программирования, 654 
ФАОТОЕІЛЈ8Н ($]), переменнчя, 741 
ФАОТОГ.ОАР, переменная, 395, 435, 731 
АОТОГОАО, подпрограмма, 395, 430, 435 
АщоГоадег, модуль 
загрузка пакетов, 396 
и загрузка по требованию во время 
выполнения, 986 
определение функций, 169 
'АщобрИф, модуль, 395, 689 
ацоцве, прагма, 169, 936 
ак, программа, 975 


Ъ, команда отладчика, 581 

В, последовательность род, 700 

Ъ, оператор проверки файлов, 129 
-В, оператор проверки файлов, 130 
\Ь, метасимвол, 233 
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\В, метасимвол, 284 
\Ь, экранированная последовательность, 93, 
213 
\В, экранированная последовательность, 213 
$Ь, переменная, 731 
В;:ВасКепа, модуль, 543 
В::Ву4есоде, модуль 
и генерация кода, 538 
как сервер компиляции, 543, 544 
описание, 544 
“С, модуль, 588, 543, 544 
:СС, модуль, 538, 543, 544 
::Рерагзе, модуль, 543, 546 
;:Ра тот, модуль, 543 
;СгарВ, модуль, 543 
Таль, модуль, 548, 545 
Біле, модуль, 548 
:;:ХгеЁ, модуль, 543, 546 
=ђасК, директива род, 697 
Базе, прагма 
@ТЗА, переменная, 422 
и прагма рагепт, 957 
описание, 937 
ФВАЅЕТІМЕ ($^Т), переменная, 731 
ВАЗН_ЕМу, переменная среды, 625 
ВЕСІМ, блоки 
и вопросы областей видимости, 328 
и фаза компиляции, 533, 535 
порядок выполнения, 548 
=бђеріп, директива род, 698 
Ыріпё, прагма 
и мультипликативные операторы, 125 
и операторы сдвига, 127 
и поразрядные операторы, 138 
и скалярные значения, 91 
описание, 938 
Ыгпит, прагмғ, 125, 939 
и скалярные значения, 91 
Біргаі, прагма, 125, 939 
и скалярные значения, 91 
Ылагу, ключ, 458 
Ыпа, функция, 528, 780 
ВІММОРЕ, метод 
связывание дескрипторов файлов, 487 
Ыптобе, функция, 291, 649, 686, 781 
Ъапк, класс символов, 226 
Ыезз, функция 
и конструирование объектов, 417 
и конструкторы объектов, 346 
и наследуемые конструкторы. 419 
и ссылки, 848 
и функция Че, 462 
описание, 782 
примеры использования, 449 
ЫН, прагма, 618, 939 
Войеап, модуль, 655 
ЪгеаК, ключевое слово, 156, 650, 783 
В5р::Кеѕоигсе, модуль, 645 
Ву4еГоадег, модуль, 544 
БУ5, прагма, 939 


а: 


Алфавитный указатель 


С 


с, команда отладчика, 582 
С, последовательность род, 700 
С, язык программирования, 975 
приемы программирования, 650 
-с, ключ командной строки, 558 
-С, ключ командной строки, 558 
-с, оператор проверки файлов, 129 
-С, оператор проверки файлов, 130 
/св, модификатор, 200 
\с, экранированная последовательность, 98 
\С, экранированная последовательность, 213 
\сМ, экранированная последовательность, 93 
саПег, функция, 593, 783 
Сарёиге::Т ту. модуль, 690 
Сагр, модуль 
сагр, функция, 465, 924 
сІџсКк, функция, 924 
сопѓеѕѕ, функция, 465, 810 
сгоак, функция, 465, 810, 960 
управление неизвестными именами, 407 
саёрой, программа, 704 
СОРАТН, переменная среды, 625 
сһагпатеѕ, прагма 
сһа:патез::ѕ(гіпе уіапате, функция, 943 
сһагпатеѕ::уіасоде, функция, 948 
сһагпатеѕ::уіапате, функция, 943 
ујасоде, функция, 820 
загрузка названий кодов символов, 289 
и метасимволы, 217 
описание, 940 
поиск во время выполнения, 942 
пользовательские имена символов, 942 
Сразе, модуль, 937 
сһаіт, функция, 785 
СНЕСК, блоки, 533, 548 
ФСНП.р ЕВВОВ ($?), переменная, 112 
и межпроцессные взаимодействия, 514 
и функция с]оѕе, 790 
описание, 781 
сһтоа, функция, 785 
сһотр, функция, 786 
сһор, функция, 787 
сһомп, функция, 788 
сһт, функция, 789 
сһгоо+, функция, 637, 790 
СТазз::Сопітасі, модуль, 489 
С1аѕѕ::Миќітеќёћоа, модуль, 656 
СІТЕА КЕ, метод 
связывание массивов, 475 
связывание хешей, 481 
СТОБЕ, метод 
связывание дескрипторов файлов, 486 
сюзе, функция 
и каналы, 514 
описание, 790 
СІоѕеаіг, функция, 791 
стр (сравнение), оператор, 59, 132, 306 
спігі, класс символов, 227 
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ФСОМРНІМС ($^), переменная, 731 
Сотргепепѕіхе ТеХ Агсһіуе М№еімогк (СТАМ, 
архив ТеХ), 600 
Сопѓіє, модуль, 911, 965 
и переменная %5ІС, 502 
и переносимость, 685, 692 
и целочисленные форматы, 761 
настройка переменных, 568 
соппесї, функция, 791 
сопѕёап+, прагма, 335, 458, 944 
сопііпџе, инструкция, описание, 792 
сопііпое, ключевое слово, 650 
и оператор #1уеп, 155 
сопііпие, оператор 
и оператор ѓогеасһ, 163 
СОВЕ, псевдопакет, 408 
соге]іві, утилита, 930 
Сого, модуль, 663 
соз, функция, 792 
соуег, инструмент, 613 
срап, команда, 609 
СРАМ (Сотргеһепѕіуе Рег! Агсіпуе МебугогК) 
зеркалирование, 600 
и тіпісрап, 603 
история, 600 
клиенты, 609 
обзор репозитория, 601 
отслеживание ошибок, 606 
поиск, 605 
создание дистрибутивов, 610 
тестирование, 606, 612 
установка модулей, 607 
экосистема, 604 
СРАМ Ѕеагеһ, сайт, 605 
СРАМ Теѕіегз, инфраструктура тестирова- 
ния, 606, 612 
СРАМ№.рт, модуль, 609, 691 
СРАМ::Ріѕіпате1пїіо, модуль, 406 
СРАМ::Мии, модуль, 608 
СРА №ерзѕ, инструмент, 601, 606 
сраптіпиѕ, клиент. 610 
СРАМРІЛЈ5, библиотека, 609 
сгурі, функция, 798 
Сгурї::*, модули, 794 
=сиѓ, директива род, 697 
Сма, модуль, 663, 785 


р 

а, команда отладчика, 582 

О, команда отладчика, 582 

-4, ключ командной строки, 559, 577, 931 

-О, ключ командной строки. 559 

-д, оператор проверки файлов, 129 

/А, модификатор, 193, 198, 200, 203 

\а, метасимвол, 221 

\0, метасимвол, 221 

\а, экранированная последовательность, 213 
\О, экранированная последовательность. 218 
_ ФАТА_ , лексема, 101, 711 

РАТА, дескриптор файла, 293, 781 
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Оаа::Оиштр, модуль, 280, 369 
Даа::Оитрег, модуль, 369 
и переносимость, 687 
сохранение структур данных, 383 
Дае::Рагзе, модуль, 691 
"ЮаќеТіте, модуль, 692 
ОВ, модуль, 578, 589 
"ЮВ Е1Пе, модуль, 794, 911 
%)В::аПаз, переменная, 588 
%ПВ::аНазез, переменная, 587 
@ПВ::агёз, переменная, 598 
©РВ::дЫіпе, переменная, 594 
%В:: ше, переменная, 594 
$0В::деер, переменная, 594 
$ОВ::досст@, переменная, 587 
$0В::ірпа], переменная, 592 
$ОВ:: эт@е, переменная, 580, 592 
&ПВ::ѕиЬ, переменная, 594 
%РВ::виБ, переменная, 593 
$ОВ::ёгасе, переменная, 580 
ОВО::5ОЕ{е, модуль, 691 
ОВ, модуль, 420, 691 
ОВМ_ЕЩег, модуль, 296, 795 
дбтсіозе, функция, 461, 794 
Чтореп, функция, 461, 794 
дда, графический отладчик, 590 
ФРЕВОССІМС ($7), переменная, 732 
РЕЕІМЕ, блок, 274 
дебпеа, функция, 477, 795 
ОЕГЕТЕ, метод 
связывание массивов, 471, 475 
связывание хешей, 481 
беІеќѓе, функция, 797 
дергесаїѓе, прагма, 946 
РЕЅТКОҮ, метод, 467 
деструкторы экземпляров, 432 
связывание дескрипторов файлов, 488 
связывание массивов, 471, 474 
связывание скаляров, 463 
связывание хешей, 482 
Пеуе!:: Аззег6 ОБ, модуль, 685 
Пеуе!::СБесКОВ, модуль, 685 
Пеуе]::Соуег, модуль, 618 
Пеуе!::ОРго{, модуль, 559, 595 
Оеуе1::МУТРгоф, модуль, 595, 598 
"Пехе1::Реек, модуль, 342 
"Реуе1:: КЕРІ, модуль, 654 
Деуе!::ЗтаПРгоф, модуль, 595 
Піаспоѕісз, прагма, 667, 946 
Піе, функция, 501, 798 
Ріреѕі::*, модули, 794 
011, класс символов, 227 
Різѕі::21]а, модуль, 612 
Ріѕітібийоп::СооКег, модуль, 611 
до (блок), инструкция, 800 
до (блок), оператор, 156 
до (#1е), инструкция, 800 
до (ѕибгоибпе), инструкция, 801 
Пос (каталог СРАМ), 601 
-аё, ключ командной строки, 559 


Алфавитный указатель 


аотр, функция, 568, 802 
Ришруаше, модуль, 369 
РупаГоадег, модуль, 396 


Е, последовательность род, 700 
-е, ключ командной строки, 553, 561 
-Е, ключ командной строки, 558, 561 
-е, оператор проверки файлов, 129 
/е, модификатор, 208, 266, 676 
\е, экранированная последовательность. 98. 
213 
\Е, экранированная последовательность, 94, 
213 
еасЬ, функция, 802 
ФЕЕЕЕСТІУЕ СКООР 10 ($)), переменная, 
782 
ФЕЕРЕСТІҮЕ ОЕК Ір ($>). переменная, 
782 
етасз, редактор, 588 
Епсоде, модуль 
и переменная ${“ЕМСОГМС}, 732 
и прагма ореп, 955 
и прагма и 18, 967 
и текстовые файлы, 855 
описание, 294 
Епсоде::1.оса1є, модуль, 295 
$ГЕМСООМС}, переменная, 732 
епсодіпё, прагма, 571, 948 
=епсодіпе, директива род, 696 
ЕМО, блоки 
и фаза исполнения, 534 
и фаза компиляции, 533 
=епа, директива роа, 698 
_ ЕМО__, лексема 
и директивы род, 711 
описание, 100 
__ЕМО__, маркер 
описание, 553 
порядок выполнения, 548 
Епұ1іѕһ, модуль 
и переменная $15Т ЅЕРАКАТОЕ, 98 
форматы шаблонов, 767 
Епу, модуль, 651 
ЕМУ, переменная среды, 625 
%ЕМУ, переменная. 788 
ЕОЕ, метод 
связывание дескрипторов файлов, 487 
еоЁ, функция, 662, 803 
ед (равно), оператор, 59, 132 
Еггпо, модуль, и переносимость, 693 
Ф$ЕЕЕМО ($!). переменная, 740 
%ЕКЕМО (%!), переменная, 741 
еѕсаре-последовательности, 93 
еуа1, функция 
и меченые данные, 621 
и обработка исключений, 804 
и отладчик, 580 
описание, 804 
приемы программирования, 6177 


Алфавитный указатель 


эффективность, 658 
ФЕУАІ, ЕВБОВ ($0), переменная, 621, 733 
Ф$ЕХСЕРТОМ$ ВЕІМС САОСНТ (5), 

переменная, 783 

ехес, функция, 628, 806 
ФЕХЕСОТАВІЕ МАМЕ ($), переменная. 738 
ЕХЕЗТЬ, метод 

связывание массивов, 471, 474 

связывавие хешей, 481 
ехіѕіѕ, функция, 477 

описание, 808 

связывание массивов, 474 
ех\, функция, 810 
ехр, функция, 810 
Ехресї, модуль, 518 
(@ЕХРОЕТ, переменная, 404, 734 
@ЕХРОЕКТ ОК, переменная, 404, 734 
%ЕХРОВТ_ТАС$Ь, переменная, 404, 734 
Ехрогтег, модуль, 388 

ітрогі, метод, 400, 937 

и вопросы закрытости модулей, 403 

и переменная @ЕХРОВТ, 734 

и переменная @ЕХРОКТ ОК, «34 

и переменная @ЕХРОВТ ТАСВ, 734 
ЕХТЕМЬ, метод, связывание массивов, 474 
ФЕХТЕМОЕО 05_ЕВВОВ ($^Е), переменная, 

784 

Ехо 5::МаКеМаЕег, модуль, 9839 
Ех з::ММ_УМб5, модуль, 691 


Е 


{, команда отладчика, 584 
Е, последовательность род, 700 
-#, ключ командной строки, 561 
-Е, ключ командной строки, 562 
-Ё, оператор проверки файлов, 129 
\#, экранированная последовательность, 93, 
213 
\Е, экранированная последовательность, 94, 
213 
$`Е($5У5ТЕМ_ЕО_ МАХ), переменная, 746 
и дескрипторы файлов, 510 
и функция @епо, 813 
(СЕ, переменная, 734 
ТаНЬаск, ключ, 457, 460 
Ес, функция, 297, 811 
ЕспИ, модуль 
и символические имена, 786, 814, 876 
и функция їспії, 811 
їспії, функция, 511, 811 
{еабиге, прагма 
зау, возможность, 561, 949 
зба{е, возможность, 561, 949 
з\Цев, возможность, 561, 949 
џипісоде 41053, возможность, 197, 561, 
949 
и области видимости, 777 
описание, 948 
{ееріпе сгеаїигіѕт, 712 
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РЕТСН, метод, 466 
и связывание скаляров, 463 
связывание массивов, 471, 473 
связывание хешей, 419 
ЕЕТСНЯШЕ, метод 
связывание массивоь, 471, 474 
%ФЕТЕТ.Р8, переменная, 734 
біеІа5, прагма 
описание, 589, 949 
функция пем, 358 
функция рћаѕћ, 358 
ЕТРО, каналы, 519 
__ЕШЕ __, лексема, 100, 810 
Е1Пе::Ваѕепате, модуль, 400, 688 
Е]е::сһтоа, модуль, 786 
ЕЙе::Сору, модуль, 870 
Е1]е::С1оЬ, модуль, 408, 827 
ЕПе::Нотеріг, модуль, 688 
КИе::Мар, модуль, 521, 664 
ЕПе::РафВ, модуль, 814 
ЕПе::Зрес, модуль, 688 
Е\]е::Тетр, модуль, 636, 688 
<ЕП.ЕНАМОГЕ>, оператор, 867 
ЕШЕМО, метод 
связывание дескрипторов файлов, 487 
#епо, функция, 813 
#1еез+, прагма, 950 
ЕпавВіп, модуль, 953 
ЕЩВЗТКЕУ, метод, связывание хешей, 481 
Лоск, функция 
и обработка сигналов, 504 
обработка состояния гонки, 682 
описание, 506 
=Фог, директива род, 698 
Ғог, оператор, описание, 65 
и модификаторы, 150 
Тогеасһ, инструкция 
приемы программирования, 651 
эффективность, 658 
Ғогеасһ, оператор, описание, 161 
и модификаторы. 150 
Хогк, функция 
и обработка сигналов, 502 
и указатели файлов, 512 
описание. 815 
Ғогтаї, функция, 816 
ФЕОВМАТ ЕОВМЕЕЕР ($1). переменная, 
784, 769 
ФҒОЕМАТ МЕ ВКЕАК СНАКАСТЕВБ 
{$:). переменная, 735, 767 
$ЕОВМАТ ЫМЕЗ_ГЕЕТ ($-), переменная, 
769, 771 
$ЕОВМАТ 11МЕЅ РЕБ РАСЕ ($-), перемен- 
ная, 785, 769 
$ЕОКМАТ МАМЕ ($-), переменная, 735, 769 
$ЕОВМАТ РАСЕ_МОМВЕВ ($%), перемен- 
ная, 735, 769 
$ЕОВКМАТ ТОР МАМЕ ($^), переменная, 735, 
769, 771 
огтіпе, функция, 817 
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с 
-&, оператор проверки файлов, 130 
/=, модификатор, 200, 203 
\С, метасимвол, 235 
\=, экранированная последовательность, 213 
\С, экранированная последовательность, 213 
СОВМ_ЕЦе, модуль, 509, 795 
ве (больше или равно), оператор, 59, 132 
Сеагшап, модуль, 668 
СЕТС, метод 

связывание дескрипторов файлов, 485 
вес, функция, 660, 817 
сеївгепі, функция, 818 
сеїівтріа, функция, 818 
Беќвтпат, функция, 819 
веоѕіруадаг, функция, 819 
&еозФупате, функция, 820 
сеіћозіепіё, функция, 820 
сено, функция, 821 
сеїіпеіуаайг, функция, 821 
веіпеЊупате, функция, 821 
сеїпеѓепі, функция, 821 
Сеќёорі::Г.опе, модуль, 546, 883 
Сеќорі::564, модуль, 883 
Береегпате, функция, 528 
Беірвтр, функция, 822 
веёрріа, функция, 822 
дебргюгНу, функция, 822 
БефргоюБупате, функция, 823 
веёргоюбупитьег, функция, 823 
Бергоїоепї, функция, 823 
бебрмепть, функция, 828 
вефрупаш, функция, 824 
верулма, функция, 824 
рефзегуБупаше, функция, 824 
хезегубурог&, функция, 825 
хеЁзегуетф, функция, 825 
вефзоскпаше, функция, 825 
веіѕосКкорё, функция, 826 
Еіхеп, оператор, 63, 153 
2105, функция, 115, 408, 826 
етиште, функция, 530, 827 
воќо, оператор, 168, 658, 828 
стайаііоп, сценарий, 49 
втарһ, класс символов. 227 
егер, функция, 829 
84 (больше), оператор, 59, 182 
Буіт, редактор, 588 


н 


Н, команда отладчика, 583 

-В, ключ командной строки, 562 

\В, метасимвол, 221 

\Н, метасимвол, 221 

\Н, экранированная последовательность, 213 
%^Н, переменная, 735 

$^Н, переменная, 735 

№2х5, инструмент, 611 

Назь: О, модуль, 353, 400, 572 


Алфавитный указатель 


=һеай1. директива род, 696 
=һеад2, директива род, 696 
ћех, функция, 530 

НОМЕ, переменная среды, 570 


І, последовательность род, 699 
-, ключ командной строки, 562 
1, ключ командной строки, 564 
/1, модификатор, 198, 203 
и оператор т//, 200 
и поиск без учета регистра, 297 
$1 ($ІМРІ.АСЕ ЕПТ), переменная, 736 
і, оператор 
и модификаторы, 150 
описание, 62, 152 
16, прагма, 919, 950 
ТЕЗ, переменная среды, 625 
ітрог+, метод класса, 470, 830 
(@ІМС, переменная, 736, 928 
%ІМС, переменная, 736 
іпс:Јаѓеѕё, модуль, 929, 950 
іпдех, функция. 303, 831 
ПМТ, блоки 
и вопросы областей видимости, 328 
и фаза исполнения, 534 
и фаза компиляции, 533 
порядок выполнения, 548 
ФІМРІ.АСЕ_ЕПІТ ($71), переменная, 736 
ФІМРОТ ИМЕ МОМВЕК ($.). переменная, 
786 
$ІМРОТ КЕСОКр ЅЕРАКАТОЕ ($/), 
переменная, 787, 866 
іпі, функция, 831 
іпіевег, прагма, 125, 670, 950 
10сії, функция, 832 
ІО::ЕПе, модуль 
пем ётрѓіе, функция, 635 
описание, 906 
ІО::Напае, модуль, 770, 906 
аифюйЙазВ, метод, 808, 852 
ипбес, функция, 818 
ипќаіпё, функция, 623 
доступ к специальным переменным, 770 
и жесткие ссылки, 355 
и структуры данных, 381 
приемы программирования, 648 
ссылки на таблицы символов, 348 
ГО::Р%у, модуль, 518 
ТО::КаЫе, модуль, 816, 907 
10::5еІесї, модуль, 517, 879 
1::боскеї, модуль, 524, 780, 791 
Ю::8оскеё: МЕТ, модуль, 525, 526, 527 
ТО::;ЗосКей::ТР, модуль, 526 
ТО: У!гарТ1е, модуль, 495 
ТРС щегргосез Соттипісаііор ~ межпро- 
цессные взаимодействия) 
Бузфет У ІРС, 520 
дополнительные сведения, 500 
каналы, 512 


Алфавитный указатель 


описание, 499 

сигналы, 499, 500 

сокеты, 523 

файлы, 505 
ІРС::Ореп2, модуль, 517, 858 
ІРС::ОрепЗ, модуль, 517, 853 
ІРС::Кип, модуль, 690 
ІРС::бетарћһоге, модуль, 880 
ІРС::ЅһагеаЫе, модуль, 521 
ІРС::буѕіет::5ітріе, модуль, 690 
ІРС::8уѕУ, модуль 

и функция тесі], 842 

и функция тѕесеќ, 842 

и функция тевгсу, 842 

и функция тєұѕод, 842 

и функция зетс, 880 

и функция ѕетбеї, 880 

и функция зетор, 880 

и функция ѕһтеії, 883 

и функция ѕһтееї, 883 
(@ІЅА, переменная, 738 

и наследование классов, 421 
13 іаіпіеӣ, функция, 621 
=ќет, директива род, 697 


Ј 


Јауа, язык программирования, 655 
јоіп. функция, 888 


к 

-К, оператор проверки файлов, 130 

\К, экранированная последовательность, 213 
\К, экранированная последовательность, 218 
Кеуз, функция, описание, 833 

К, функция, 885 


І. 


1, команда отладчика, 584 

Т., команда отладчика, 582 

Г, последовательность род, 700 

"1, ключ командной строки, 554, 564 

-1, оператор проверки файлов, 129 

Л, модификатор, 193, 200, 203 

\1, экранированная последовательность, 94, 
213 

\Ё, экранированная последовательность, 94, 
214 

1-значение (термин), 83 

$7. (ФРОКМАТ ЕОЕМЕЕЕО), переменная, 
784, 769 

125%, оператор, описание, 67, 835 

приемы программирования, 650 

1аѕё, операция, и управление циклами, 164 

@ТГАЗТ МАТСН ЕМР (@+), переменная, 677, 
788 

@ТАЗТ МАТСН ЗТАВТ (@-), переменная, 
677, 788 

$ГАЗТ РАКЕМ МАТСН ($+), переменная, 
789 
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%Т.АЗТ РАКЕМ МАТСН (%+), переменная, 
789 
$ГАЗТ ВЕСЕХР СОрЕ КЕЗОІТ (ФБ), 
переменная, 789 
ФГАЗТ 5ОВМАТСН_КЕЅОІТ ($^М), 
переменная, 739 
1с, функция, 836 
С _А11,, переменная среды, 570 
С СОТ.АТЕ, перемєннан среды, 570 
ІС СТҮРЕ, переменная среды, 570 
ІС МОМЕКІС, переменная среды, 570, 767 
1сЯгз+, функция, 886 
1е (меньше или равно), оператор, 59, 132 
Іепе+ћ, функция, 303, 836 
1еѕѕ, прагма, 951 
ПБ, прагма 
загрузка модулей, 399 
и переменная среды РЕКІ511ІВ, 573 
описание, 952 
ПЪлев, библиотека, 525 
помум, библиотека, 525 
_ ЫМЕ__, лексема, 100, 887 
Вок, функция, 887 
$5Т ЗЕРАВАТОВ ($), переменная, 98, 740 
ТАН, модуль, 880 
птеп, функция, 837 
1оса1, оператор, описание, 181, 837 
приемы программирования, 648 
юса!::НЬ, модуль, 610 
1осае, прагма 
и модификаторы шаблонов, 197 
описание, 953 
оса те, функция, 530, 839 
1оск, функция, 343 
ГОСК_ЕХ, флаг, 506 
ГОСК_БН, флаг, 506 
108, функция, 840 
ТОСПОІК, переменная среды. 570 
Іопејтр, функция, 504 
1ю\ег, класс символов, 227 
1ѕќаї, функция, 840 
ќ (меньше), оператор, 59, 182 


м 


-та, ключ командной строки, 565 
-М, ключ командной строки, 565 
М, оператор проверки файлов, 180 
/т, модификатор, 198, 200, 203 
Ф^М, переменная, 740 
п//, оператор поиска по шаблону, 96, 199 
интерполяция строк в двойных кавыч- 
ках, 189 
описание, 840 
поддерживаемые модификаторы, 200 
Ма!::МаЦег, модуль, 525, 690 
Маі::бепа, модуль, 690 
Маі::бепатаіі, модуль, 690 
таіп, пакет, 391, 392 
тап, команда отладчика, 587 
тар, функция, 841 
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$(МАТСН), переменная, 740 
$МАТСН ($8), переменная, 740 
Мав::В1е ЕР оаф, модуль, 939 
Маіћ::ВірІрё, модуль, 446, 939 
Маїћ::В12Ваё, модуль, 939 
Ма :;Капдот::МТ::Рей, модуль, 864 
Маіћ::Капіот::8есиге, модуль, 864 
Маіһ::Тгів, модуль 

асоз, функция, 792 

авіп, функция, 885 

бап, функция, 780 
Маїһ::ТгшуКапдӣот, модуль. 864, 895 
Метоізе, модуль, 660 
МеаСРАМ, сайт, 601, 605 
Меіһойв::8ієпаёигев, модуль, 656 
питерап, создание зеркала СРАМ, 603 
тКаіг, функция, 841 
МІРВМ, модуль, 495 
Мо, каркас, 445 
шоа _регі, расширение (Арасће), 542 
Мойише::Виіа, модуль, 939, 950 
Модше::Соге! 156, модуль, 930 
Мойиех:5іагіег, модуль, 611 
тобщез (каталог СРАМ), 601 
Мојојісіоцѕ, модуль, 602 
Моо, модуль, 445 
Моозе, модуль, 401, 443, 445 
Моицзе, каркас, 445 
тго, прагма, 429, 954 
МКО::Сотраё, модуль, 425 
тзесії, функция, 842 
товвеѓ, функция, 842 
тзёгсу, функция, 842 
тѕвѕпа, функция, 842 
ту, объявление, 44, 177 
ту, оператор, описание, 843 


п, команда отладчика, 580, 581 

-п, ключ командной строки, 565 

\М, метасимвол, 217 

\п, экранированная последовательность, 93, 
214 

\М, экранированная последовательность, 93, 
214 

$`М ($ЪАЗТ 50ОВМАТСН_ КЕЅОІТ), 
переменная, 739 

пе (не равно), оператор, 59, 132 

М№Меї:: ОМ, модуль, 525 

М№еі::ЕТР, модуль, 525 

М№Меї::һоѕіепё, модуль, 820 

М№Меі::пеїепі, модуль, 821 

М№Меі::ММТР, модуль, 525 

М№Меі::ргоќѓо, модуль, 828 

М№еї::ѕегуепі, модуль, 825 

М№еї::5МТР, модуль, 525 

Ме: Тешев, модуль, 525 

пем, метод-конструктор, 845 

пехі, оператор, описание, 67, 845 

приемы программирования, 650 
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пехї, операция, и управление циклами, 164 
МЕХТКЕУ, метод, связывание хетей, 482 
МЕС, форма нормализации, 300 
МЕР, форма нормализации, 300 
МЕКС, форма нормализации, 300 
МЕКО, форма нормализации, 300 
по, оператор (противоположность иѕе), 401, 
470, 846 
потеіћой, ключ, 457 
М№Митђег, модуль, описание, 956 
туада, функция, 956 
тузиЬ, функция, 956 
МҮТРКОЕ, переменная среды, 599 


о 


о, команда отладчика 
аггауреріћ, параметр настройки, 591 
АџќоТгасе, параметр настройки. 590 
сотрасірипр, параметр настройки, 591 
аіеГ еуе1, параметр настройки, 589 
ОитррвЕ1еѕ, параметр настройки, 591 
БирРасКарез, параметр настройки, 591 
РишрВеизед, параметр настройки, 591 
тате, параметр настройки, 590 
е1оБрРгіп+, параметр настройки, 591 
ҺаѕвһЮеріһ, параметр настройки, 591 
іпһіЫіё ехії, параметр настройки, 590 
Гале, параметр настройки, 590 
пахТгасеГ.еп, параметр настройки, 591 
огпатепїз, параметр настройки, 590 
равег, параметр настройки, 589 
РгіпёКеї, параметр настройки, 590 
геса Соштап4, параметр настройки, 589 
БћеђВапұ, параметр настройки, 589 
51 паШеуе!. параметр настройки, 589 
1ККоппіпе, параметр настройки, 589 
уегуСотрасі, параметр настройки, 591 
\агиГеуе!, параметр настройки, 589 

О, команда отладчика, 587 

-о, оператор проверки файлов, 129 

-О, оператор проверки файлов, 129 

-0, ключ командной строки, 554, 557 

/о, модификатор. 193, 200, 203 

\о, экранированная последовательность, 98, 

214 
\0, экранированная последовательность, 98, 
213 

О_АРРЕМЮ, флаг функции зузорев, 904 

О ВМАВУ, флаг функции ѕуѕореп, 904 

О СКЕАТ, флаг функции ѕуѕореп, 904 

О ЫВЕСТОВУ, флаг функции ѕуѕореп, 904 

О ЕХСІ.. флаг функции зузореп, 635, 904 

О ЕХГОСК, флаг функции зузореп, 904 

О ГАВОЕЕШЕ, флаг функции зузореп, 904 

О МОЕГБАУ, флаг функции ѕуѕореп, 904 

О_МОСТТУ, флаг функции вувореп, 904 

О МОРО. ОМ, флаг функции зузореп. 635, 

904 
О МОМВГОСК, флаг функции ѕуѕореп, 904 
О _ КРОМІТ, флаг функции ѕуѕореп, 904 
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О КОМЕ, флаг функции зузореп, 904 
О БНІОСК, флаг функции ѕуѕореп, 904 
О ЅҮМ№С, флаг функции зузореп, 904 
О ТЕОМС, флаг функции зузореп, 904 
О \ВОМГУ, флаг функции ѕуѕореп, 904 
осі, функция, 92, 846 
ород, программа, 704 
Орсоде, модуль, 640, 956 
ОРЕМ, метод 
связывание дескрипторов файлов, 485 
ореп, прагма 
Буфев, фильтр, 574, 955 
егі, фильтр, 574, 955 
:епсойіпе, фильтр, 955 
Посае, фильтр, 955 
ттар, фильтр, 574 
:регШо, фильтр, 574 
:рор, фильтр, 574 
там, фильтр, 574, 955 
:54а, фильтр, 955 
:5% о, фильтр, 574 
иних, фильтр, 574 
11428, фильтр, 574, 955 
:1у1132, фильтр, 575 
и ключ -С, 559 
и функция геад, 865 
определение кодировки, 292 
приемы программирования, 649 
ореп, функция, описание, 847 
взаимодействие посредством каналов, 515 
вызов с ограниченными правами, 627 
и каналы, 513 
и состояние гонки, 685 
и указатели файлов, 512 
осторожность при работе с внешними 
данными, 626 
параметры, 51 
приемы программирования, 649 
орепдіг, функция, 855 
орз, прагма, 955 
ога, функция, 855 
$ОЗМАМЕ ($70), переменная, 685, 740 
оиг, объявление, 44, 179 
оит, оператор, описание, 855 
$ООТРОТ_АОТОЕГОЗН ($]), переменная, 769 
ФООТРІЈТ ЕТЕ.р ЗЕРАВАТОВ ($,), 
переменная, 741 
ФООТРОТ КЕСОКЮ ЅЕРАКАТОК ($\), 
переменная, 741, 861 
=оуег, директива род, 697 
%ОУЕВГОАЮ, переменная. 742 
оуегоай, прагма 
Меќћоа, функция, 460 
Оуегіоадеа, функция, 459 
буа, функция, 459 
описание, 447, 956 
оуе|оа 1 тр, прагма, 956 


Р 


р, команда отладчика, 588 
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-р, ключ командной строки, 566 
-Р, ключ командной строки, 565 
-р, оператор проверки файлов, 129, 519 
/р, модификатор, 193, 200, 203 
\р. экранированная последовательность, 214 
\Р, экранированная последовательность, 214 
раск, функция, 857 
описание, 755 
_ РАСКАСЕ__, лексема, 100, 859 
раскабе, объявление, 387, 393 
лексема __РАСКАСЕ__, 393 
раскабе, оператор 
описание, 857 
рагепё, прагма 
(©@ІЅА, переменная, 422 
и прагма Базе, 957 
описание, 957 
рагѕе орііопѕ, функция (отладчика) 
Мп юр, параметр, 591 
поТТУ, параметр, 591 
ВеааТлпе, параметр, 591 
ТТУ, параметр, 591 
РАТН, переменная среды, 566, 57С, 625. 978 
Раїћһ::СІаѕѕ, модуль, 688 
?РАТТЕКМ№?, команда отладчика, 584 
/РАТТЕКМ/, команда отладчика, 584 
РАОЗЕ (Рей Аипогз Ороа4 Ѕегуег), 600 
РОГ, модуль, 371 
Регі, язык программирования 
место установки, 556 
обзор, 38 
профилирование, 595 
РЕВГ._АГГОУ/ МОМ№ъХ ТЕЅ 15Р, переменная 
среды, 570 
РЕНІ, ВАРГАМС, переменная среды, 570 
РЕКІ, РЕВОС_МЯТАТЬ, переменная среды, 
571 
РЕБКІ, ОЕЗТВКОСТ ГЕУЕГ,, переменная 
среды, 571 
РЕВГ. Юі, МОМГА2Ү, переменная среды, 571 
РЕБКІ, ЕМСОЮІМС, переменная среды, 511 
РЕВІ, НАН 85ЕЕр РЕВОС, переменная 
среды, 572 
РЕВІ, НАЗН_БЕЕЮ, переменная среды, 571 
РЕВГ. МЕМ ТОС, переменная среды, 572 
РЕВТ._ВООТ, переменная среды, 572 
РЕВТ._СМАГ, переменная среды, 505, 572 
РЕВГ ОМІСОРЕ, переменная среды, 575 
настройка стандартных потоков ввода/ 
вывода, 293 
отключение поддержки Юникода, 559 
приемы программирования, 649 
Рег!::Сишис, модуль, 81, 671 
Рет1::Тіау, модуль, 648, 671, 707 
РЕВІ5рВ, переменная среды, 570, 589 
РЕБВІ50В ТНКЕАРЕРр, переменная среды, 
570 
РЕКІ51/В, переменная среды, 573 
РЕБКІ.55НЕ1І,, переменная среды, 572 
ре ив, инструмент, 606 


1026 


ФРЕВІРВ ($?Р), переменная, 742 
РЕВТОВ_ОРТ$, переменная среды, 588 
РегПО, модуль, 847 
РЕВНЮ, переменная среды, 518 
РЕКШО РЕВОС, переменная среды, 575 
РЕВИШЧЛВ, переменная среды, 575 
$РЕВГ_УЕКЗ1ОМ ($^У), переменная, 742 
РеиХ::МефодСа ПУЛ Воск, модуль, 655 
РейХ::Вапее, расширение, 655 
РСР::*, модули, 794 
-рЬ, расширение файлов, 932 
ріре, функция, 518, 859 
.рі, расширение файлов, 932 
—ро@, директива род, 697 
род (рат о!4 доситетща# оп – простая старая 
документация) 
буквальные абзацы, 696 
директивы, 696 
документирование программ, 710 
как игнорируемый текст, 81 
ловушки, 709 
модули и трансляторы, 702 
описание, 694 
поток текста, 699 
создание собственных инструментов, 703 
трансляторы род, 694 
род2 1, модуль, 702 
род21а%ех, модуль, 702 
род2тап, модуль, 702 
род2%ехф, модуль, 702 
ройсһесКег, утилита, 703 
Роа:;Сһескег, модуль, 703 
Роа::РѕецӣоРод, модуль, 699 
Роа::85ітрІе, модуль, 703, 705 
Роа::5ітріе::Техі, модуль, 705 
РОЕ, модуль, 663 
РОР, метод, связывание массивов, 471, 476 
рор, функция, 859 
рогіз (каталог СРАМ“), 602 
роз, функция, 303, 860 
РОЗІХ, модуль 
асоѕ, функция, 792 
аѕіп, функция, 885 
_ехії, функция, 810 
Беїаіїг, функция, 818 
шкй_Ю, функция, 519 
зе Иосае, функция, 197 
ѕеізіа, функция, 881 
э1ергостазК, системный вызов, 504 
зи ите, функция, 828, 840 
{ап, функция, 780 
ётрпат, функция, 635 
блокировка сигналов, 504 
и символические имена, 876 
$ГРОЗТМАТСН}, переменная, 743 
$РОЗТМАТСН ($°), переменная, 742 
ФРКЕМАТСН ($), переменная, 743 
$ РКЕМАТСН)}, переменная, 743 
ргіпі, класс символов, 227 
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РБВІМТ, метод 
связывание дескрипторов файлов, 485 
ргіпё, функция, 861 
приемы программирования, 647 
эффективность, 658 
РЕМТЕ. метод 
связывание дескрипторов файлов, 486 
реп, функция 
модификаторы формата, 751 
описание, 749, 862 
эффективность, 658 
$РКОСЕЗ$$ Ір ($$), переменная, 743 
$РКОСКАМ_ МАМЕ ($0), переменная, 743 
ргоѓоѓуре, функция, 863 
ргоуе, инструмент, 613 
рипсї, класс символов, 227 
РОЗН, метод, связывание массивов, 471, 475 
риѕһ, функция, 863 
Руоп, язык программирования, 652 


9 


а, команда отладчика, 586 

\9, экранированная последовательность, 94, 
214 

9//, оператор заключения в кавычки, 96. 864 

д9//, оператор заключения в кавычки, 96 

аг//, оператор заключения в кавычки, 96, 190, 
251 

дпофетеа, функция, 864 

4%//, оператор заключения в кавычки, 96 

9х//, оператор заключения в кавычки, 96 


г, команда отладчика, 581 
В, команда отладчика, 580, 586 
-г, оператор проверки файлов, 129 
-В, оператор проверки файлов, 129 
/т, модификатор, 203, 650 
\г, экранированная последовательность, 93, 
214 
\В, экранированная последовательность, 214 
$^В ($ГАЗТ КЕСЕХР СОрЕ КЕЗОГТ), 
переменная, 739 
г-значение (термин), 83 
тапа, функция, 864 
те, прагма, 644 
КЕАР, метод 
связывание дескрипторов файлов, 486 
геаӣ, функция, 865 
геадаіг, функция, 865 
ВЕАПШММЕ, метод 
связывание дескрипторов файлов, 485 
геадіпе, функция, 141, 866 
геадіпк, функция, 867 
геаар1ре, функция, 643, 867 
ФКЕА1, СКООР Ір ($0, переменная, 744 
$КЕАІ, ОЅЕБ 1р ($<), переменная. 744 
гесу, функция, 868 
гедо, оператор, 868 
гедо, операция, и управление циклами, 164 
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ге:епеіпе:Л.РЕС, модуль, 288 
ге::епе те: :Тлла, модуль, 283 
теепдіпе::Опісигита, модуль, 283 
ге::епеше::РСВЕ, модуль, 288 
ге::епр1пе::Р1ап9, модуль, 283 
ге::епяте::Рирт, модуль, 283 
техепеєіпе:КЕ2, модуль, 283 
геї, функция, описание, 868 

и жесткие ссылки, 355 
Керехр, модуль, и жесткие ссылки, 355 
Кевехр::Сгаттагз, модуль, 218 
тетоуе сопѕіапі, функция. 458 
гепате, функция, 869 
геашге, функция, 399, 870 
геѕеё, функция, 872 
гефигп, оператор, 873 
теуегѕе, функция, 141, 878 
геміпааіг, функция, 874 
гіпдех, функция, 303, 874 
гтаіг, функция, 874 
Вибу, язык программирования, 654 


5 


5, комында отладчика, 581 
$, команда отладчика, 584 
5, последовательность ро, 700 
-в, ключ командной строки, 566 
'5, ключ командной строки, 554, 566 
-в, оператор проверки файлов, 129 
-8, оператор проверки файлов, 129 
/з, модификатор, 193, 200, 203 
\з, метасимвол, 221 
\5, метасимвол, 221 
\з, экранированная последовательность, 214 
\Ѕ, экранированная последовательность, 214 
$^5 (ФЕХСЕРТ1ЮМ$ ВЕІҸС САОСНТ), 
переменная, 733 
5/// (подстановка), оператор, 96 
интерполяция строк в двойных кавыч- 
ках, 189 
описание, 874 
поддерживаемые модификаторы, 203 
эффективность, 660 
Баїѓе, модуль 
геуа1, метод, 639, 641 
защищенные разделы, 638 
карантин программного кода, 637 
ограничение доступа к операторам, 640 
примеры использования, 641 
работа с небезопасным кодом, 638 
ѕапабох (песочница), определение, 688 
настройка, 638 
вау, ключевое слово, 874 
зса]аг, псевдофункция, 875 
Зсааг Оі, модуль, 363 
ѕеё ргобобуре, функция, 335 
їаіпіеа, функция, 621 
разрыв ссылок, 482 
всгірі кіааіе, 979 
ѕсгіріѕ (каталог СРАМ), 602 
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5ОВМ_ЕЦе, модуль, 691 
зе, программғ. 979 
ЅЕЕК, метод 
связывание дескрипторов файлов, 486 
ѕеек, функция, 686, 876 
ѕеекаіг, функция, 877 
ѕеІесі (готовые дескрипторы файлов), 
оператор, 878 
заес& (дескриптор выходного файла), 
оператор, 877 
беіесібауег, модуль, 878 
бе 1.оадег, модуль. 169, 396, 936 
зетсИ, функция, 880 
зетяе$, функция, 880 
ѕетор, функция, 880 
ѕепа, функция, 880 
зерёгр, функция, 881 
ѕеїргіогіїу, функция, 881 
веіѕосКкорї, функция, 882 
Эней, модуль, 396 
ЭНЕШ,, переменная среды, 554 
ЭНТЕТ, метод, связывание массивов, 471, 476 
361%, функция, 882 
эффективность, 658 
ѕћтсії, функция, 883 
5иМет, пакет, 522 
ѕһтпреї, функция, 888 
ѕртгеаа, функция, 884 
звшмитНе, функция, 884 
ви оу, функция, 527, 884 
%8ІС, переменная, 500, 744 
ѕірігар, прагма 
и обработка сигналов, 501 
предопределенные списки сигналов, 960 
преобразование сигналов в исключения, 
549 
приемы программирования, 667 
примеры использования, 961 
прочие аргументы, 961 
ѕіп, функция, 885 
Веер. функция, 885 
Бтагі::Соттепіѕ, модуль, 81 
.8о, расширение файлов, 982 
Зоскеф, модуль 
АЕ ІМЕТ, атрибут, 819 
серозИлт, функция, 820 
іпеі поа, функция, 819 
ВОІ, ЗОСКЕТ, атрибут, 826 
и переводы строки, 686 
описание, 524 
сетевые серверы, 527 
восКкеї, функция, 885 
зосКеёра, функпия. 518, 886 
зог%, прагма, 962 
Богі, функция 
и алгоритм ОСА, 812 
и прагма ѕогі, 962 
и текст Юникода, 306 
и хеши массивов, 878 
обработка списков, 75 
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описание, 886 
врасе, класс символов, 227 
РЫСЕ, метод, связывание массивов, 471, 476 
вріісе, функция, 890 
эффективность, 658 
рф, функция, 891 
и разделители, 68 
эффективность, 662 
зрг и, функция 
модификаторы формата, 751 
описание, 749, 894 
поддерживаемые форматы, 750 
числовые преобразования, 751 
ваг%, функция, 894 
згапа, функция, 895 
згс (каталог СРАМ), 602 
зіаё, функция, 895 
бабе, объявление, 179 
вїаїе, оператор, описание, 897 
ЭТРЕВВ, дескриптор файла, 746, 979 
и межпроцессные взаимодействия, 510 
описание, 51 
БТРІМ, дескриптор файла, 746, 979 
и межпроцессные взаимодействия, 510 
описание, 51 
ЭТРООТ, дескриптор файла, 746, 979 
и межпроцессные взаимодействия, 510 
описание, 51 
БфогаЫе, модуль, 384 
и переносимость, 687 
ЭТОВЕ, метод, 467 
связывание массивов, 471, 473 
связывание скаляров, 463 
связывание хешей, 480 
БТОКЕЅІ7Е, метод 
связывание массивов, 471, 474 
еігісё, прагма 
и голые слова, 964 
и модификатор ту, 779 
и переменные, 88, 184, 964 
и ссылки, 963 
описание, 46, 962 
приемы программирования, 646, 649, 667, 
60 
работа с небезопасным кодом, 689 
бігисі::С1азз, модуль, 434 
заду, функция, 897 
505, объявление, 899 
формирование анонимных подпрограмм, 
346 
ви6$, прагма, 430, 965 
$5ОВСЕТРТ 5ЕРАКАТОВ ($3, переменная, 
110, 746 
воибвіт, функция, 232, 303 
описание, 900 
эффективность, 660 
эффективность по памяти, 663 
зиарен, программа, 681 
БОРЕК, псевдокласс, 426 


Алфавитный указатель 


ЗушЪ а, модуль 
функция ацаП Ру іо геѓ, 333 
зутшПок, функция, 902 
зувсаЙ, функция, 902 
БҮЅФІ.ОСІМ. переменная среды, 576 
ѕуѕореп, функция 
и блокировка файлов, 508 
и состояние гонки, 635 
описание, 903 
осторожность при работе с внешнимк 
данными, 626 
вувгеаа, функция, 906 
эффективность, 660 
зуззеек, функция, 906 
ѕуѕіет, функция, 907 
вызов с ограниченными правами, 627 
эффективность, 662 
Зущет У ТРС, механизм межпроцессных 
взаимодействий, 520 
$ЗУ5ТЕМ ЕЮ МАХ ($^`Е), переменная, 746 
и функция Шепо, 813 
зузмгИе, функция, 908 


т 


+, команда отладчика, 582 
Т, команда отладчика, 579, 582 
+, ключ командной строки, 567, 629 
-Т, ключ командной строки, 568, 629 
-, оператор проверки файлов, 129 
Т, оператор проверки файлов, 180 
\, экранированная последовательность, 93, 
214 
ФТ (ФВАЗЕТИМЕ), переменная», 731 
$ГТАПМТ}, переменная, 747 
Таіпё:1061, модуль 
фапцед, функция, 621 
тать, функция, 621 
ТАР (Теѕё АпумвВеге РгоїосоЇ — универсаль- 
ный протокол тестирования), формат, 613 
ТЕЦШ,, метод 
связывание дескрипторов файлов. 486 
дей, функция, 686, 909 
сеПаіг, функция, 909 
Тегт::ВеадКеу, модуль, 588, 818, 883 
Тегт:;ВеабЕлпе, модуль 
поддержка отладчика, 588 
Тегт::Кепдегуоиз, модуль, 592 
Теѕ+:: Моге, модуль, 618 
Теѕё::Роаӣ, модуль, 708 
Теѕі::Роа::Соуегаре, модуль, 703 
Техі:: Аитоюгтаф, модуль, 805 
Техі::СРР, модуль, 565 
Тһе Ореп Боигсе Сопѓегепсе (ОЗСОМ), 
конференция, 715, 718 
Тһгеадѕ, модуль, 965 
геа@з, прагма 
азупс, функция, 966 
описание, 965 
ТЬгеа4з::биеце, модуль, 967 
Не, функция, описание, 910 


Алфавитный указатель 


Тіе:: Аггау, модуль, 471, 911 
Тіе::Сасһе:1.КО, модуль, 495 
Тіе::Сопѕё, модуль, 495 
Тіе::Соипіег, модуль, 468, 495 
Тіе::СРНаѕћ, модуль, 495 
Тіе::СусІе, модуль, 469, 495 
Тле:: ОВ, модуль, 495 
Тіе::Рісї, модуль, 496 
Тіе::РісЕПе, модуль, 496 
Тіе::ОМ№, модуль, 496 
Тіе::ЕпсгурќейНавһ, модуль, 496 
Тіе:: Ее. БКОСасћһе, модуль, 496 
Тіе::ЕНрЕ1ор, модуль, 496 
Т!е::Нап е, модуль, 911 
"Тіе::Наѕһ, модуль, 47, 911 
Тіе::НавћРеѓаџіёѕ, модуль, 496 
"Тіе::НавНіѕіогу, модуль, 496 
Тіе::Назћ::МатедСаріше, модуль, 730 
Тіе:1Саі, модуль, 496 
"Тіе::ІхНавћ, модуль, 496 
"Тіе::.РАР, модуль, 496 
"Тіе::Регзізіепі, модуль, 496 
Тіе::Ріск, модуль, 496 
"Тіе:ВОВМ, модуль, 496 
Тіе::КеғНаѕћ, модуль, 362 
Тіе::ЅсаЈаг, модуль, 463, 911 
Тіе::ЅесигеНазѕћ, модуль, 439 
"Гіе::514 Аггау, модуль, 472 
Тіе::5ТОЕКК, модуль, 496 
"Тіе::5їаНаѕћ, модуль, 477 
Тіе::5108са1аг, модуль, 463 
Тіе::ЗибвітНаѕћЬ, модуль, 663 
Тіе::5увіое, модуль, 496 
"Тіе::Техіріг, модуль, 496 
'Гіе::Торе1е, модуль, 496 
Тіе::Т2, модуль, 496 
Тіе::УесА тгау, модуль, 496 
Те; УВ, модуль, 496 
ТТЕАВКАУ, метод, 478 

связывание массивов. 471, 473 
иеа, функция, 911 
ТІЕНАМО.Е, метод 

связывание дескрипторов файлов, 484 
ТТЕНАЗН, метод, связывание хешей, 478 
ТТЕЗСАГАВ, метод, 465 

и связывание скаляров, 463 
бте, функция, 912 
Тіте::єтіёйте, модуль, 828 
Тіте::НіВеѕ, модуль, 879 

иеер, функция, 885 

и сигналы, 780 
Тіте::Іоса1, модуль, 691, 828 

бітпес, функция, 828 

+1 теюса], функция, 889 
Типе: оса Нлте, модуль, 840 
+1 тез, функция, 912 
ТК, модуль, 420, 666 
ТМТО\ГТИТ, аббревиатура, 51 
{гой Е, наборный язык, 979 
фгипса*е, функция, 913 


1029 


Тгу:Тіпу, модуль, 334 

4г/// (транслитерация), оператор, 190 
описание, 912 
поддерживаемые модификаторы, 207 


у 


-и, ключ командной строки, 568 
-0, ключ командной строки, 568, 629 
-и, оператор проверки файлов, 129 
Га, модификатор, 193, 200, 208 
\и, экранированная последовательность, 94, 
214 
\О, экраһированная последовательность. 94. 
214 
ис, функция, 913 
осйгѕё, функция, 298, 913 
итазк, функция, 914 
ипаеѓ, значение, 38 
цпаеѓ, функция, 915 
и обработчики перегрузки, 447 
эффективность, 662 
ипдегвсоге, модуль, 470 
$СОМСОрЕ}, переменная, 747 
Отисойе::СазеЕо14, модуль 
#с, функция, 297, 811 
1с, функция, 536 
ис, функция, 913 
Хпісоде::СоПаќе, модуль 
стр, метод, 811 
ед, метод, 811 
и нормализация, 311 
и операторы сравнения, 132 
метод вогї, 312 
описание, 304, 306 
поддержка алгоритма ОСА, 306 
сортировка с учетом региональных 
настроек, 313 
ХОпісоде::СоПаѓе::.осаје, модуль 
стр, метод, 811 
ед, метод. 811 
и операторы сравнения, 132 
сортировка с учетом региональных 
настроек, 318 
Хпісоде СоЙабоп Аісогіїрт, ОСА (алгоритм 
упорядочивания Юникода), 306 
Хісоде::СС9їгіпе, модуль 
іпдех, метод, 881, 874 
роз, метод, 831, 874 
тіпаех, метод, 831, 874 
ѕибѕёг, метод, 901 
и двоичные форматы, 768 
описание, 305 
поддержка графем, 304, 887, 861 
усечение строк, 788 
форматирование строк, 755 
форматы шаблонов, 766, 768 
Хпісоде::1іпеВгеак, модуль, 305, 768 
1Опісоде::М№Могтајізе. модуль 
описание, 301 
функция МЕС, 335 
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функция МЕБ, 335 
Озсоде::Верех::Зеф, модуль, 319 
Опксоде::Тизе, модуль 

программа исзог%, 307 

программа ип1 т, 306 
Опісоде::ОСР”, модуль, 315 
упітрогі, метод, 401 
ъпітрогі, метод класса, 470 
ОМІТСНЕСК, блоки, 533, 548 
ОМІУЕБК5АІ,, класс 

сап, метод, 428 

РОЕБ, метод, 428 

іѕа, метод, 427 

УЕБЯЗОМ, метод, 429 

и проверка версий, 405 

наследование классов, 427 
111е55, оператор, описание, 63, 152 

и модификаторы, 150 
ипНок, функция, 916 
ипраск, функция, 917 

описание, 755, 764 
ОМНІЕТ, метод 

связывание массивов, 471, 475 
оцзый, функция, 917 
ОМТИЕ, метод, 467 

связывание дескрипторов файлов, 487 

связывание массивов, 471, 474 

связывание скаляров, 463 

связывание хешей, 482 
ипйе, функция, 917 
ипіі], оператор, описание, 64, 159 

и модификаторы, 150 
иррег, класс символов, 228 
ове, объявление, и прагмы, 182 
изе, оператор, описание, 917 
Озег::#гепф, модуль, 818, 819 
Овег::рмепё, модуль, 824 
и 8, прагмы, 144, 290, 293, 967 
$ГОТЕ8САСНЕ}, переменная, 747 
Ф(ЎОТЕВГОСАТЕ}, переменная, 747 
ийте, функция, 919 


ү 


У, команда отладчика, 583 
НівћВі, параметр настройки, 591 
диоќе, параметр настройки, 591 
ипде#Ргіпё, параметр настройки, 591 
ОзавеОщу, параметр настройки, 591 
-у, ключ командной строки, 568, 931 
У, ключ командной строки, 568 
\у, метасимвол, 221 
\У, метасимвол, 221 
\у, экранированная последовательность, 214 
\У, экранированная последовательность, 214 
$`У ($РЕБКІ, УЕВЗЮМ), переменная, 742 
уашез, функция, 920 
уагз, прагма, 967 
уес, функция, эффективность по памяти, 668 
$УЕВЗЮМ, переменная, 748 
УЕВЗ1ОМ, метод, 405 


Алфавитный указатель 


уегѕіоп, модуль, 406, 967 
и жесткие ссылки, 355 

уі, редактор, 588 

уіт, редактор, 588 

утѕіѕћ, прагма, описание, 968 
ехіё, возможность, 968 
ћиѕћед, возможность, 968 
зфафив, возможность, 969 
біте, возможность, 969 


М 


У, команда отладчика, 579, 584 
УУ, команда отладчика, 582 
-м, ключ командной строки, 569, 630 
№, ключ командной строки, 569 
-м, оператор проверки файлов, 129 
№, оператор проверки файлов. 129 
\у, метасимвол, 221 
\Ұ, метасимвол, 221 
\м, экранированная последовательность, 214 
\У, экранированная последовательность, 214 
уаії, функция, 508, 922 
ма _раа, функция, 508, 922 
мапѓаггау, функция, 102, 923 
магп, функция, 923 
ФҰАЕМІМС (Ф^У), переменная, 748 
Ф(“МАЕМІМС ВІТ), переменная, 748 
магпіпёѕ, прагма 
магпіпеѕ::епаЫей, функция, 972 
магпіпЕ5::гебівтег, функция, 972 
магпіпаѕ::уагпіѓ, функция, 972 
магпіпез, прагма 
магпіпев::жагп, функция, 972 
включение предупреждений, 569 
описание, 183, 969 
приемы программирования, 646, 647, 652, 
667 
мћеп, оператор, описание, 63 
и интеллектуальное сопоставление, 156 
и модификаторы, 151 
Һе, инструкция 
приемы программирования, 649 
“ће, оператор, описание, 64, 159 
и модификаторы, 150 
ФҰІРЕ БҮЗТЕМ САТ), переменная, 748 
№1п32::Ріре, модуль, 519 
№1п32::Ргосеѕѕ, модуль, 816 
У1п82::ТіеКерізігу, модуль, 496 
${`\/1М32_5ГОРРУ_Б5ТАТ}, переменная, 748 
мога, класс символов, 228 
ҰҮЕІТЕ, метод 
связывание дескрипторов файлов, 487 
утЦе, функция, 924 
Уух, модуль, 666 


х 


х, команда отладчика, 583 

Х, команда отладчика, 583 

Х, последовательность род, 700 

-х, ключ командной строки, 558, 569 


Алфавитный указатель 


-Х, ключ командной строки, 569 

-х, оператор проверки файлов, 129 

-Х, оператор проверки файлов, 129 

/х, модификатор, 193, 200, 203 

\х, метасимвол, 216 

\х, экранированная последовательность. 93, 
214 

\Х, экранированная последовательность, 214 

$`Х (ФЕХЕСОТАВГЕ МАМЕ), переменная, 
783 

хе, класс символов, 228 

ХМЕ::Рагсзег, модуль, 382, 678 

Х$ (еЖжегпа! Зибгоийпе, внешняя подпро- 
грамма), 611, 690 


У 


У/// (транслитерация), оператор, 96, 190, 925 
Үе Апоёћег Рег! Сопѓегепсе (УАРС), конфе- 
ренция, 715 


2 


2, последовательность род, 701 

-2, оператор проверки файлов, 129 

\2, метасимвол, 233 

\2, метасимвол, 233 

\2, экранированная последовательность, 214 
\2, экранированная последовательность, 214 


СугіШс 
А 


абстракции, определение, 411 
автодекремент (--), оператор, 122 
автозагрузка, 980 
генерация методов доступа, 435 
методов, 480 
пакетов, 395 
автоинкрементирование, 980 
автоинкремент (++), оператор, 122 
автоматическая генерация, 981 
автоматическое выполнение (отладчика), 591 
автоматическое расщепление, 981 
алгоритм, 981 
алгоритм упорядочивания Юникода (Оп1соде 
СоПайоп А]вог т, ОСА), 306 
алфавитный, 981 
альтернативы, 981 
аннотации к функциям, 778 
анонимные каналы, 518 
анонимные объекты ссылки. 342 
анонимный, 981 
аргументы, 981 
командной строки, 981 
подпрограмм, 324 
приемы программирования, 651 
функция ореп, 51 
арифметические операторы, 981 
бинарные (двухместные), 54 
перегрузка, 448, 449, 451 
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унарные, 57 
арность, 117 
архитектура, 981 
асинхронная обработка событий, 663 
ассоциативность, 117, 982 
ассоциативный массив, 40, 982 
атом, 79, 982 
атомарная операция, 982 
атомарные группы, 262 
атомарный квантификатор, 982 
атрибуты, 982 


Б 
базовый класс, 410. 982 
байт, 982 
байт-код, 533, 982 
безопасность 
данных 
и зачистка окружения, 625 
и ограниченные права, 627 
и очистка меченых данных, 621 
обход режим: проверки меченых 
данных, 629 
описание, 618, 621 
кода 
защищенные разделы, 688 
изменение корневого каталога, 687 
карантин программного кода, 687 
код, маскирующийся под данные, 643 
описание, 637 
обработка ненадежных данных, 618 
обработка ошибок синхронизации, 630 
ошибки защиты в ядре ОМХ, 631 
работа с ненадежным кодом, 637 
бесплатно доступное, 982 
бесплатное программное обеспечение, 982 
бесплатно распространяемое, 982 
библиотека, 983 
определение, 927 
бинарные операторы, 983 
аддитивные, 126 
логические, 139 
математические операторы, 54 
мультипликативные, 125 
обработчики, 447 
оператор автодекремента, 122 
оператор автоинкремента, 122 
оператор взятия по модулю, 125 
оператор возведения в степень, 123 
оператор вычитания, 126 
оператор деления, 125 
оператор интеллектуального сопоставле- 
ния, 133 
оператор связывания, 124 
оператор сдвига влево, 127 
оператор сдвига вправо, 127 
оператор сложения, 126 
оператор стрелки, 121 
оператор умножения, 125 
операторы равенства, 132 
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операторы сравнения. 182 
описание, 117 
бит, 983 
битовая строка, 983 
биты разрешений, 983 
благословение (термин), 417 
блоки, определение, 151 
и составные операторы, 151 
и циклы, 167 
блочная буферизация, 983 
булев контекст, 983 
буфер, 983 
буферизация команд, 984 
буферизация строк, 984 


В 
вариадические функции (термин), 323 
вектор, 984 
версий литералы, 100 
верхнего регистра символы, 296 
верхний регистр, 984 
ветвление, 984 
процессов, 502 
взломщик, 984 
взятие по модулю (%), оператор, 125 
виртуальный, 984 
висячая команда, 984 
владелец, 984 
вложенные подпрограммы, 358 
внешние подпрограммы (Х$), 690 
возведение в степень (**), оператор, 54, 123 
возвращаемое значение, 984 
волшебное инкрементирование, 985 
волшебные переменные, 985 
волшебство (термин), 461 
временная память, 985 
временные значения, 84 
встраивание, 985 
встроенная функция, 985 
замещение, 407 
приемы программирования. 649 
прототипы, 337 
встроенные документы, 98 
приемы программирования, 675 
вывод 
массивов массивов, 368 
массивов хещей, 376 
многомерных хешей, 378 
структур данных, 381 
хешей массивов, 374 
вызов методов, 412 
и косвенные объекты, 414 
вызов по значению, 985 
вызов по ссылке, 985 
вызывающий, 985 
выполнение кода, 540 
выполняемые модули, определение, 928 
выражения, 985 
и составные операторы, 151 
высокомерие, качество, 712, 718, 985 
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вычитание (-), оператор, 126 


г 


генераторы кода, 543, 986 
Ђаскепа-модули, 543 
определение, 533 

генераторы программ, 680, 986 

генераторы функций, 357 

генерация кода, 588 
фаза генерации кода, 533 

главный хранитель, 986 

глаголы в естественных языках, 47 

глобальное разрушение, 986 

глобальные объявления, 172 

голые слова 
и прагма ѕітісі, 964 
описание, 97 
приемы программированих, 649 

грамматические шаблоны, 273 

графемы, 986 
и нормализация, 299 
и форматы строк, 755 

группирование в поиске по шаблону, 188 

группировка 
при поиске по шаблону, 236 

группы, 986 
атомарные, 262 

группы процессов, передача сигналов, 502 


Д 


дамп памяти, 986 
данные экземпляра, 986 
датаграмма, 986 
дата и время, переносимость. 691 
двойная жизнь, 987 
двоичные форматы 

раск, функция, 755 

ипраск, функция, 755 

описание, 155 
декрементирование, 987 
деление (/), оператор, 125 
деление по модулю (%), оператор, 54 
дерево грамматического разбора, 533, 536 
дерево синтаксического анализа, 987 
дескриптор каталога, 987 
дескриптор файла, 51, 987 

и состояние гонки, 634 

приемы программированин, 648 

связывание, 482 

созидающие, 490 
дескрипторы ссылки, 347 
деструктор, 987 

деструкторы экземпляров, 431 
Джеффри Фридл ФеЁгеу Егіеа!), 68 
Джон Орвант (оп Огжапћ), 714 
диапазон (..), оператор, 140 
динамическая область видимости, 174, 987 
директивы род, 696 
дистрибутивы, определение, 928 

для СРАМ, 610 
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дисциплина, 987 
документирование программ, 710 
доллара знак ($) 
разыменовывающий префикс, 84 
доступа, методы, 987 
генерация с помощью автозагрузки, 485 
генерация с помощью замыканий, 436 
определение, 419 
примеры использования, 433 
Дэн Фэйджин (рар Еаіріп), 713 


единицы компиляции, 89, 987 
естественные языки 

и глаголы, 47 

и компиляторы, 586 


Ж 


жадный, 987 
жесткие ссылки, 987 
и замыкания, 856 
и методы объектов, 353 
и оператор обратной косой черты, 358 
и оператор стрелки, 351 
и переменные, 350 
и псевдохеши, 353 
описание, 341 
жизненный цикл программы, 588 


Е 


заглавного регистра символы, 296 
заглавный регистр, 988 
заголовочный файл, 988 
закрытость, модулей, 408 
закрытые методы, 431 
закрытые объекты, 437 
замещение, 988 
замыкание, 436, 988 
генерация методов доступа, 436 
подпрограммы, 356 
запись, 988 
запятая (,), оператор, 146 
зарезервированные слова, 988 
захват, 988 
при поиске по шаблону, 236 
значения 
временные, 84 
левосторонние (1-значения), 88 
массивов, 98 
определение, 83 
по умолчанию, 989 
правосторонние (г-значения), 88 
скалярные, 90 
зомби, 989 
процессы, 508 


И 


идентификатор, 989 
определение, 80, 391 
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идеографические унарные операторы, 128 
имена 
модулей, 402 
описание, 85 
поиск, 88 
полностью квалифицированные, 87 
файлов 
Е1оЬ, функция, 115 
и состояние гонки, 634 
именованные сохраняющие группы, 240 
именованный канал, 519, 989 
имя команды, 989 
имя файла, 989 
инвокант, 985 
определение, 412 
инициализатор, 419 
инициализационные файлы, настройка 
отладчика, 588 
инкапсуляция (термин), 410. 989 
инкрементирование, 989 
интеллектуального сопоставления (--), 
оператор, описание, 188 
сопоставление объектов, 137 
интерполирующий контекст, 104 
интерполяция 
значений массивов, 98 
обратного слэша, 37, 249 
переменных, 87, 248, 990 
строк в двойных кавычках, 189 
условная, 271 
шаблона на этапе поиска, 270 
интерпретатор, 990 
и компиляторы, 540, 547 
команд, 990 
приемы программирования, 651 
интерфейс, 990 
командной строки 
обработка команд, 552 
переменные среды, 569 
инфиксный оператор, 117, 990 
исключений обработка в подпрограммах, 326 
исключительная ситуация, 990 
исполнения фаза, определение, 534 
исполняемый образ, 534 
исполняемый файл, 534, 990 
итеративные операторы, перегрузка, 449, 454 
итератор, 990 
итерация, 990 


К 


кавычки, 95 
каналы, 990 
ЕІЕО, 519 
анонимные, 518 
взаимодействия между процессами, 515 
двунаправленные взаимодействия, 517 
именованные, 519 
определение. 512 
каноническая 
декомпозиция, 300 
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композиция, 300 
канонический, 990 
карантин программного кода, 637 
каталоги СРАМ, 601 
квалифицированные имена, 391 
квантификатор, 990 
квантификаторы, 71, 211, 229 
и поиск по шаблону, 229 
описание, 188 
примеры использования, 188 
эффективность, 659 
Кевин Ленцо (Кеуіп Теп2о), 715 
класса методы, 409 
классы, 990 
базовые, 410 
как пакеты, 411 
надклассы, 410 
наследование, 410, 421 
определение, 409, 928 
подклассы, 410 
приемы программирования, 656 
производные, 410 
родительские, 410 
символов, 70, 219, 657 
в стиле РОЅІХ, 225 
и метасимволы, 220 
свойства символов, 222 
управление данными, 440 
цитирующие имя пакета, 416 
кластер ключей, 991 
клиенты 
поддержки СРАМ, 609 
сетевые, 525 
ключевое слово, 991 
ключ/значение, пары 
массивы хешей. 375 
описание, 88 
ключи, 991 
определение, 88 
хешей, 361 
кода выполнение, 540 
кода генерация, 588 
кодовые пункты 
графемы и нормализация, 299 
регистр, 296 
коды символов, 991 
доступ к данным, 291 
кодировка ОТЕ-8, 290 
описание, 287, 775 
команды, 991 
и ограниченные права, 627 
обработка, 552 
отладчика, 580 
поддерживаемые ключи командной 
строки, 557 
команды, ввод (обратные кавычки), оператор, 
111 
комбинационный символ, 991 
комментарии и символ #, 81 
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компиляторы и компиляция, 991, 992 
Ђаскепа-модули, 543 
выполнение кода, 540 
генераторы кода, 543 
жизненный цикл программы, 533 
и интерпретаторы, 540, 547 
компилирование кода, 534 
логические проходы, 537 
описание, 532 
регулярных выражений, 252 
средства разработки кода, 545 

компиляции, фаза, определение. 533 

конвейер, 513, 992 

конец файла, 992 

констант, перегрузка, 458 

конструкторы, 410, 992 
и инициализаторы, 419 
и функция йе, 462 
копирования, 456 
наследуемые, 418 
объектов, 346, 418 
определение, 418 

конструкции 
кавычки, 95 
циклические, 64, 159 

контекст, 992 
интерполирующий, 104 
логический, 102 
описание, 101 
пустой, 103 
скалярный, 74, 101 
списочный, 74, 101 

контрольная точка, 992 

контрольное выражение, 992 

копирования (=), конструктор. 456 

косвенные объекты, 992 
и вызов методов, 414 
и синтаксис, 415 

косвенный дескриптор файла, 992 

коэффициент Шварца, 603 

кракозябры, 998 

Крис Нандор (Сһгіѕ Мапдог). 715 

круглые скобки () 

в правилах предшествования, 120 
культура Рег 

дополнительная информация, 712 

история развития, 712 

получение справки, 719 

поэзия Рен, 716 

события, 718 
кэш (термин), 363 


Л 

левое значение, 993 

лексема, 585, 993 
и пробельные символы, 81 
определение, 80 

лексическая переменная, 993 
описание, 177 
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лексические области видимости, 993 
и прагмы, 174 
определение, 927 
поиск имен, 88 
лексический анализатор, 535, 993 
лень, качество, 712. 717. 993 
литералы, 994 
версий, 100 
псевдолитералы, 111 
строковые, 92 
числовые, 92 
логические операторы, 139 
перегрузка, 449, 451 
логический контекст, описание, 102 


м 
Марк Биггар (Магк Вієраг), 713 
маски, поиск файлов, 115 
массива значение, 98 
массивы, 39 
ассоциативные, 40 
индексы, 39 
и разыменовывающий префикс, 85 
и списки значений, 104 
многомерные, 365, 370 
модификация еп таѕѕе, 205 
определение, 39, 83 
приемы программирования, 648 
размер, 107 
связывание, 471 
формирование анонимных массивов, 344 
хешей, 373, 375 
эффективность, 661 
массивы массивов 
доступ и вывод, 368 
описание, 365 
распространенные ошибки, 371 
создание и доступ, 366 
срезы, 870 
массивы хешей, 375 
генерирование, 376 
доступ и вывод, 876 
формирование, 375 
математические операторы, 54 
перегрузка, 449, 458 
метазнак, 994 
метасимволы, 209, 994 
групповые, 217 
квантификаторы, 211 
общие, 210 
описание, 186, 209 
позиций, 232 
расширенные последовательности 
регулярных выражений, 212 
таблицы, 210 
часто используемые, 209 
метка цикла, 994 
метод, 994 
автозагрузка, 430 
вызов, 412 
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доступа, 419, 433 

достун к замещенным методам. 425 

закрытые, 431 

как подпрограммы, 411 

класса, 409, 994 

конструкторы, 410 

объектов, 358 

определение, 321, 409 

приемы программирования, 656 

связывание дескрипторов файлов, 484 

связывание хешей, 477 

связывания массивов, 472 

связывания скаляров, 463, 464 

экземпляра, 409 
мехавизм передачи по ссылке, 324, 329 
меченые данные, очистка, 621 
минимализм, 994 
многомерные массивы, 370 
многомерные хеши, 109 

генерирование, 377 

доступ и вывод, 378 

имитация, 109 

описание, 377 

формирование, 877 
многомерный массив, 995 
многоточия (...), оператор, 171 
множественное наследование, 995 
модификатор инструкции, 995 
модификатор левостороннего значения, 995 
модификаторы 

замкнутые, 244 

и оператор //, 200 

и оператор 5///, 203 

и оператор &г///, 207 

команд, 660 

регулярных выражений. 193, 995 

формата, 751 

шаблонов, 193, 244 
модули, 995 

вопросы закрытости, 403 

выбор имени, 402 

выгрузка, 401 

загрузка, 399 

замещение встроенных функций, 407 

и трансляторы род, 102 

определение, 398, 927 

пример, 402 

проверка версий, 405 

создание, 401 

тестирование, 612 

установка из СРАМ, 607 

экспортирование, 405 

электронная документация, 398 
мягкая ссылка, 995 


н 


надклассы, 410 
наследование. 995 
классов 
автозагрузка методов, 480 
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доступ к замещенным методам. 425 
и закрытые методы, 431 
и класс ОМГУЕВЗАТ,, 427 
и переменная @]С5А, 421 
описание, 421 
конструкторы, 418 
определение, 410 
нетерпеливость, качество, 712, 717, 995 
нижнего регистра символы, 296 
нижние колонтитулы 
форматы шаблонов, 771 
нижний регистр, 995 
низкоуровневый доступ к форматированию, 
412 
номер ошибки, 995 
нормализация, 299, 300, 996 
нумификация, 996 


о 


области видимости, 996 
динамические, 174 
обработка исключительных ситуаций, 996 
обработка ошибок синхронизации 
обработка состояний гонки, 682 
описание, 630 
ошибки защиты в ядре ЈМ№ъ№ІХ, 631 
обработчики 
определение, 447 
перегрузки, 447, 457 
обработчик сигнала, 996 
обратная польская (бесскобочная) нотация, 
540 
обратная совместимость, 996 
числовые преобразования, 751 
обратного слэша интерполяция, 249 
обратные кавычки (ввод команды), оператор, 
111 
обратные ссылки, 73, 272 
и сохраненные строки, 236 
объектно-ориентированное программирова- 
ние (ООП), 409 
объектов конструкторы, 346 
объектов методы, 353 
объект ссылки, 997 
объекты, 997 
вызов метода, 412 
закрытые, 487 
и модуль Мооѕе, 443 
интеллектуальное сопоставление, 187 
как объекты ссылок, 411 
косвенные, 414 
наследование классов. 421 
определение, 409 
приемы программирования, 656 
создание, 417 
ссылки, 342 
управление данными класса, 440 
объявление (термин), 173 
объявления, 997 
ту, 44 


оиг, 44 
расКаре, 44, 387, 393 
ѕиЬ, 899 
глобальные, 172 
определение, 149 
с областью видимости. 174 
однострочник, 997 
операнд, 997 
оператор объявления, 997 
операторов перегрузка 
и прагма оуегіоаа, 447 
оператор отношения. 998 
операторы, 117, 149 
интерполяция строк в двойных кавыч- 
ках, 189 
ограничение доступа, 640 
описание, 58, 117, 149 
поиск по шаблону, 68 
правила предшествования, 118 
простые, 150 
разновидности, 117 
сопоставление с шаблоном, 68 
составные, 151 
управления циклами, 64 
операторы ввода 
обратные кавычки, 111 
поиск файлов по маске, 115 
угловые скобки, 112 
операторы сравнения, <=>, 59 
операции управления циклами, 159 
операционная система, 998 
опережающая проверка, 260, 998 
определение (термин), 173 
оптимизаторы, 535, 537, 538 
освящение. 998 
отладчик 
автоматическое выполнение, 591 
вопросы поддержки, 598 
действия и выполнение команд, 584 
исследование структур данных, 588 
настройка с помощью файлов инициали- 
зации, 588 
описание, 577 
поддерживаемые команды, 580 
поддерживаемые параметры настройки, 
588 
поддержка в редакторах, 588 
поиск программного кода, 583 
пример строки приглашения, 578 
профилировщик Реп, 595 
прохождение программы и выполнение, 
581 
режим трассировки, 582 
точки останова, 581 
отображение регистра, 998 
отслеживание ошибок в СРАМ, 606 
охватывающий оператор, 999 
очистка буфера, 999 
ошибки защиты в ядре ОМХ, 631 
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пакеты, 999 
автозагрузка, 395 
изменение, 393 
квалифицированные имена, 391 
классы как пакеты, 411 
описание, 386 
определение, 386, 927 
по умолчанию, 392 
х, разделитель, 87 
таблицы имен, 387 
память, приемы программирования, 656 
память совместного доступа, 999 
пары ключ/значение и оператор =>, 108 
перевод строки, 686 
перегрузка, 999 
диагностика, 460 
и конструкторы копирования, 456 
констант, 458 
на этапе выполнения. 460 
обработчики, 457 
операторов, 447, 999 
приемы программирования, 656 
определение, 446 
перегрузки, обработчики, 447 
передача сообщений, 530 
переключатель, 999 
переменные, 35, 1000 
и жесткие ссылки, 350 
интерполяция, 37 
и оператор обратной косой черты, 344 
и прагма ѕігісі, 88, 184, 964 
и разыменовывающие префиксы. 84 
лексические, 177, 327 
массивы, 36 
области использования, 36 
приемы программирования, 650, 652 
связанные, 461 
синтаксис, 35 
скалярные, 84 
скаляры, 86 
типы, 86 
форматов, 769 
форматы шаблонов. 769 
хеши, 36 
экземпляров, 420, 433 
приемы программирования, 656 
переменных интерполяция, 248 
переносимость 
дата и время, 691 
и взаимодействие с системой, 689 
и перевод строки, 686 
и старшинство байтов, 687 
и файловые системы, 688 
и файлы, 688 
описание, 684 
переопределение встроенных функций, 407 
перечисление (|), метасимвол, 188 
перечисление при поиске по шаблону, 244 
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песочница (ѕапабох). 1000 
настройка, 638 
определение, 638 
платформа, 1000 
побочные эффекты, 1000 
подклассы, 410 
подпрограммы, 36, 1000 
аргументы, 324 
атрибут [уаше, 339 
атрибут теіһоа, 339 
вложенные, 358 
вопросы областей видимости, 326 
замыкания, 356 
индикацӣя ошибок, 326 
и оператор обратной косой черты, 344 
и списки параметров, 324 
методы, 411 
механизм передачи по ссылке, 824, 329 
определение, 321 
приемы программирования, 655 
прототипы, 831 
синтаксис, 321 
формирование анонимных подпрограмм, 
346 
эффективность, 659 
подстановка, 1001 
оператор подстановки (5///), 1001 
примеры использования, 68 
подстрока, 1001 
подход инструментального яшика. 1001 
подшаблон, 1001 
подшаблон кода, 1001 
подшаблоны 
утверждения нулевой ширины, 187 
позиции в строках, описание, 232 
позиция косвенного объекта, 1001 
поиск в СРАМ, 605 
поиск имен, 88 
поиск по шаблону, 185, 1001 
группировка, 188, 236 
замысловатые шаблоны, 259 
и метасимволы, 186 
квантификаторы, 229 
метасимволы, 209 
описание, 68 
перечисление, 188, 244 
позиции, 282 
сохранение, 236 
специальные переменные, 724 
специальные символы, 216 
управление процессом, 246 
поиск с возвратом, 1001 
поиск файлов по маске, 115 
полиморфизм (термин), 410 
полностью квалифицированные имена, 87 
полубайт, 1002 
пользовательские прагмы, 972 
поразрядного сдвига операторы 
сдвиг влево, 127 
сдвиг вправо, 127 
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поразрядные операторы, 138 
перегрузка, 449, 452 
поразрядный сдвиг, 1002 
порядок поиска методов, 1002 
последовательности роа, 699 
поступательный поиск, 1002 
поток текста, 699 
поэзия Регі, 716 
права и безопасность данных, 627 
правила предшествования 
и знаки разыменования, 358 
описание, 118 
термы и списочные операторы, 119 
правое значение, 1002 
право первого, 1002 
прагмы, 984, 1002 
и лексические области видимости, 174 
описание, 182, 934 
определение, 928 
пользовательские, 972 
преобразования операторы 
перегрузка, 449 
препроцессинг, 1003 
префиксные операторы, 117 
привязка, 1003 
приемы программирования 
всеобщие ошибки, 647 
генераторы программ, 680 
идиоматический Регі, 671 
ловушки С, 650 
ловушки Јауа, 655 
ловушки Руѓћоп, 652 
ловушки ВоБу, 654 
ловушки интерпретатора команд, 651 
обычные промахи новичков, 646 
стиль программирования, 667 
часто игнорируемые советы, 649 
эффективность использования, 666 
эффективность перенесения, 665 
эффективность по памяти, 663 
эффективность программирования, 664 
эффективность сопровождения, 665 
приложение, 1008 
определение, 928 
приоритет, 1003 
присваивание спискам, 107 
присваивания, операторы 
описание, 55, 144 
перегрузка, 448, 449, 452 
примеры использования, 83 
пробельные символы, 81 
проверка меченых данных, 1003 
проверки, 259 
опережающие, 260 
ретроспективные, 260 
программное обеспечение с открытым 
исходным кодом, 1003 
программные шаблоны, 264 
программы 
взаимодействия посредством каналов, 515 


документирование, 710 
жизненный цикл, 583 
и переносимость, 684 
определение, 928 
производный класс, 410, 1004 
пространства имен, 926, 1004 
и дистрибутивы Регі. 602 
ограничение доступа, 638 
описание, 385 
простые операторы, 150 
протокол, 1004 
прототипы, 1004 
встроенных функций, 387 
для эмуляции встроенных функций, 332 
константных функций, 335 
описание, 381 
предосторожности при использовании, 
336 
процедуры, определение, 47 
процента знак (%), разыменовывающий 
префикс, 85 
процессы 
ветвление, 502 
взаимодействия посредством каналов, 515 
зомби, 508 
псевдолитерал, 111, 1004 
псевдоним, 1004 
имен переменных, 88, 111, 723 
псевдофункция, 1004 
псевдохеш, 353, 1004 
пустой контекст, 103, 1004 


Р 


работа с ненадежным кодом, 637 
рабочий каталог, 1005 
равенства операторы, 132 
разделители, 68 
разрыв строки, 1005 
разыменование (термин), 348 
разыменования операторы 
перегрузка, 449, 455 
разыменовывающие префиксы 
определение, 84 
типы переменных, 84 
расширения, определение, 928 
реализация, 1005 
регистр, 1005 
регистр символов, 296 
регулярные выражения, 1005 
и группировка, 236 
и метасимволы, 210 
и прагма ге, 957 
и якоря, 72 
квантификаторы, 211, 229 
компиляция, 252 
метасимволы, 186 
минимальное соответствие, 72 
обратные ссылки. 78 
определение, 68 
определение собственных границ, 316 
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особенности в Ре, 185 
приемы программирования, 657 
специальные переменные, 724 
регулярных выражений 
механизмы 
альтернативные, 282 
правила, 254 
модификаторы, описание, 193 
режим меченых данных, 617, 1006 
режим трассировки (отладчика), 582 
рекомендательные блокировки, 506, 632 
реконструкции дерева грамматического 
разбора фаза, 584 
рекурсивные шаблоны, 272 
ретроспективная проверка, 260, 1006 
родительский класс, 410, 1006 
Рэндал Шварп (Капа! Ѕеһмагіл2), 714 


С 


самооживление, 1006 
сборка мусора 
и методы РЕЗТВОУ, 432 
и ссылки, 362 
свертка регистра, 194, 1006 
определение, 297 
свертывание констант, 537 
свойства символов, 222 
связанные переменные, описание, 461 
связывание (=-), оператор, 124 
связывание дескрипторов файлов, 482 
ВІММОРЕ, метод, 487 
СІОЅЕ, метод, 486 
РЕБТВОХ, метод, 488 
ЕОЕ, метод, 481 
ЕП.ЕМО, метод, 487 
СЕТС, метод, 485 
ОРЕМ, метод, 485 
РЕІМТ, метод, 485 
РКІМТЕ, метод, 486 
КЕАР, метод, 486 
ВЕАОШМЬЕ, метод, 485 
ЗЕЕК, метод, 486 
ТЕГ, метод, 486 
ТТЕНАМОГЕ, метод, 484 
ОМТТІЕ, метод, 487 
ҰГВІТЕ, метод, 487 
поддерживаемые методы, 484 
связывание массивов 
СІ ЕАК, метод, 475 
РЕ ЕТЕ, метод, 475 
РЕЗТВОТУ, метод, 474 
ЕХІЅТЕ, метод, 474 
ЕХТЕМО, метод, 474 
ЕЕТСН, метод, 473 
ЕЕТСНЫШЕ, метод, 474 
РОР, метод, 476 
РОЗН, метод, 475 
БНІЕТ, метод, 476 
ЗРЫСЕ, метод, 476 
ЭТОВЕ, метод, 478 
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ЭТОВЕМЕЕ, метод, 474 
ТТЕАВКАУ, метод, 473 
ОМНІЕТ, метод, 475 
ОМТІЕ, метод, 474 
поддерживаемые методы, 472 
связывание скаляров 
ПЕЗТВОХ, метод, 467 
ЕЕТСН, метод, 466 
БТОВЕ, метод, 467 
ТТЕЗСАГАВ, метод, 465 
ОМТІЕ, метод, 467 
обход значение в цикле, 469 
поддерживаемые методы, 464 
связывание хешей, 477 
СГЕАБ, метод, 481 
ТЕГЕТЕ. метод, 481 
РЕЗТВОТУ, метод, 482 
ЕХІЅТ5, метод, 481 
РЕТСН, метод, 479 
ЕІКТК ЕҮ, метод, 481 
МЕХТКЕУ, метод, 482 
БТОВЕ, метод, 480 
ТЕНАЗН, метод, 478 
ОМТТЕ, метод, 482 
поддерживаемые методы, 477 
сдвиг влево (<<), оператор, 127 
сдвиг вправо (>>), оператор, 127 
семафор, 508 
серверы сетевые, 527 
сетевой адрес, 1007 
сигналы и обработка сигналов 
Поск, функция, 504 
Фогк, функция, 502 
ѕісігар, прагма, 501 
безопасность сигналов, 505 
блокировка сигналов, 504 
группы процессов, 502 
завершение медленных операций 
по тайм-ауту, 503 
зомби, 508 
и переменная %$1С, 500 
описание, 500 
преобразование в исключения, 546 
символическая ссылка, 8341, 359, 1007 
символический отладчик, 1007 
символов, классы, описание, 70 
символы 
верхнего регистра, 296 
заглавного регистра, 296 
метасимволы регулярных выражений, 
186, 209 
нижнего регистра, 296 
пробельные, 81 
свойства, 222 
символьные классы, 219 
в стиле РОЅІХ, 225 
и метасимволы, 220 
приемы программирования, 657 
свойства символов, 222 
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синтаксис 
встроенных документов, 98 
единственное число, 37 
множественное число, 39 
переменных, 35 
подпрограмм, 321 
простота, 44 
сложности, 42 
синтаксический анализ, 1008 
синтаксический сахар, 1008 
синтаксическое дерево, 1008 
системный вызов, 1008 
скаляр, 1008 
скалярная переменная, 1008 
разыменовывающий префикс, 84 
скалярные значения, 1008 
голые слова, 97 
и интерполяция значений массивов, 98 
и синтаксис встроенных документов, 98 
кавычки, 95 
литералы версий, 100 
описание, 90 
строковые литералы, 92 
числовые литералы, 92 
скалярный контекст, 74, 1008 
обработка списков, 74 
описание, 101 
скалярный литерал, 1008 
скаляры, 36 
определение, 83 
слабах ссылка, 363, 1008 
сложение (+), оператор, 54, 126 
смещение, 1009 
совместимая декомпозиция, 300 
создание ссылок, 343 
сокеты 
и межпроцессные взаимодействиях, 523 
передача сообщений, 580 
сетевые клиенты, 525 
сетевые серверы, 527 
сообщений передача, 530 
сопоставление с шаблоном, описание, 68 
приемы программирования, 652 
сопоставления, операторы, перегрузка, 449 
сортировка с учетом региональных настроек, 
818 
сортирующая последовательность. 1009 
составные операторы, 151 
состояние гонки, 1009 
обработка, 632 
определение, 632 
сохранение при поиске по шаблону, 236 
со-хранитель, 1009 
сохраняющие группы 
именованные, 240 
специальные дескрипторы файлов, 
для пакетов, 726 
специальные имена 
сгруппированные по типам, 728 
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специальные переменные в алфавитном 
порядке, 727 
специальные переменные 
в алфавитном порядке, 727 
дескриптора файла, 724 
для всей программы. 725 
пакетов, 724 
регулярных выражений, 724 
специальные функции, для пакетов, 726 
списки 
обработка, 74 
присваивание, 107 
списочное значение, 1009 
списочные операторы, 1009 
и унарные операторы, 128 
левосторонние, 119 
правосторонние, 146 
приемы программирования, 648 
списочный контекст, 74, 101, 1009 
сравнения операторы, 182 
перегрузка, 449. 453 
сравнения, операторь 
строк и чисел, 59 
среда, 1010 
срезы массивов, 5'(0, 648 
ссылки, 1010 
анонимные, 342 
жесткие, 341, 350 
и анонимные объекты ссылки. 342 
и ключи хешей, 361 
и оператор обратной косой черты, 344, 353 
и прагма ѕігісї, 963 
и сборка мусора, 362 
и ссылки на таблицы символов, 348 
на группы, 236 
на дескрипторы, 347 
на таблицы символов, 345 
обратные ссылки. 73, 272 
объекты, 411 
описание, 341 
определение, 341 
передача, 324, 329 
разыменование, 348 
символические, 341, 359 
слабые. 363 
создание, 343 
циклические, 362, 455 
стандартная библиотека Регі, 1010 
будущее, 931 
описание, 926 
старшинство байтов и переносимость, 687 
статическая переменная. 1011 
статический метод, 1011 
стек 
јитрепу, 541 
возврата. 541 
временной памяти лексических перемен- 
ных для рекурсии, 541 
контекста. 541 
маркеров, 541 
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области видимости, 541 

операндов, 541 

сохранения, 541 

список поддерживаемых, 541 
стиль программирования, 667 
страницы справочного руководства 


отдельные для разных систем, 684 


стрелка (->), оператор, описание, 121 
и вызов методов, 413 
строки 
и пробельные символы, 81 
в кавычках, 95, 360 
конкатенация, 54 
литералы, 92 
модификация еп раѕѕагі, 204 
эффективность, 661 
по памяти, 663 
строковая переменная, 787 
строковые литералы, 92 
строковые операторы, 54, 132 
структуры данных 
исследование в отладчике, 583 
массивы массивов, 365 
массивы хешей, 375 
определение, 83 
приемы программирования, 656 
сохранение, 383 
хеши массивов, 373 
хеши хешей, 377 
сценарий, 1012 
определение, 928 


т 


таблицы имен, описание, 387 
таблицы символов, 1012 

ссылки, 348 
текущий пакет, 387, 393, 1012 
терминатор, 1012 
термы 

определение, 83 

правила предшествования, 119 
тернарные операторы, 117, 142 
тестирование в СРАМ, 606 
тип данных, 1012 
точка останова, 992 

определение, 581 

поддерживаемые команды, 581 
трансляторы рой 

и модули, 702 

описание, 694 
трехчастные циклы. 65. 160 


У 


угловые скобки, оператор, 112 
узел (термин), 586 
указатель файла, 818, 1018 
умножение (*), оператор, 54, 125 
унарный оператор, 1018 
идеографические, 123 
и списочные операторы, 128 
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обработчики, 447 
описание, 57, 117 
правила предшествования, 128 
список, 127 
управляющие конструкции 
сіуеп, оператор, 63 
1+, оператор, 62 
111]е5$, оператор, 62 
уеп, оператор, 63 
условная интерполяция, 271 
условный (?:), оператор, 142 
устройство, 1013 
утверждение, 1014 
утверждения (в регулярных выражениях) 
и метасимволы, 232 
нулевой ширины, 187, 232 
определение собственных, 281 
уязвимость, 1016 


Ф 


фаза выполнения, 1014 
фаза компилнции, 1014 
файловая система, 1014 
и переносимость, 688 
файлов, указатели, 813, 1018 
файлы 
блокировка, 506 
и взаимодействия между процессами, 505 
и ограниченные права, 627 
и переносимость, 688 
исполняемые, 534 
поиск по маске, 115 
эффективность по памяти, 663 
фактические аргументы, 1014 
фатальная ошибка, 1014 
фильтр ввода/вывода, 1014 
фильтр исходного кода, 1014 
фильтры, определение, 513 
формальные аргументы, 1015 
форматы 
ѕргіпё, функция, 750 
двоичные, 755 
низкоуровневый доступ к форматирова- 
нию, 772 
переменные, 769 
строк, 749 
шаблонов, 765 
переменные форматов, 769 
формирователь, 1015 
функции, 407, 1015 
аннотации, 778 
в алфавитном порядке, 778 
константные, подставляемые. 385 
обратного вызова, 356 
описание, 321, 778 
по категориям, 776 
приемы программирования, 656 
с особенностями и отклонениями, 684 
специальные, для пакетов, 726 


1042 Алфавитный указатель 


Хх программные, 264 
хакер, 1015 рекурсивные, 272 
хеши, 40 ретроспективные проверки, 260 
и разыменовывающий префикс, 85 функций, 358 
ключи, 361 шаблон этапа выполнения, 1016 
массивов Шэрон Хопкинс (Ѕһагоп НорКіпѕ). 716 
генерирование, 378 
доступ и вывод, 374 э 
описание, 373 экземпляр, 1016 
формирование, 373 экземпляра методы, 409 
многомерные, 109. 377 экземпляров деструкторы, 481 
описание, 83, 108 экземпляров переменные 
определение, 40 определение, 420 
псевдохеши, 353 управление, 433, 440 
связывание, 477 экземпляр (термин), 409 
формирование анонимных хешей, 345 экранированные последовательности, 98 
хешей, 377 эксплойт, 1016 
хеш-таблицы, 109 экспортирование модулей, 405 
элементы, описание, 80 
Ц этап выполнения, 1016 
$цифры, нумерованные переменные, 729 этап компиляции, 1016 
циклические конструкции и операторы эффективность по времени, 658 
Хогеасћ, оператор, 161 
Іаьё, оператор, 67 Юю 
1аві, операция, 164 Юникод 
пех, оператор, 67 иёғ8, прагма, 290 
пехф, операция, 164 графемы и нормализация, 299 
гедо, операция, 164 доступ к данным, 291 
ип, оператор, 159 и сокращения в Рец, 314 
ме, оператор, 159 описание, 285 
голые блоки как циклы, 167 определение свойств, 317 
описание, 64, 159 приемы программирования, 653 
трехчастные циклы, 65, 160 регистр симьолов, 296 
циклы с условием, 64 сортировка строк, 306 
циклические ссылки, 362, 455 сравнение строк, 306 
циклов метки, 164 
циклы Я 
приемы программирования, 648 якоря, 72 


с условием, 64 
эффективность, 659 


Ч 


числа, эффективность по памяти, 668 
числовой контекст, 1015 
числовые литералы, 92 
числовые преобразования 
обратная совместимость, 751 


Шш 


шаблонов модификаторы 
замкнутые, 244 
описание, 193 

шаблоны 
атомарные группы, 262 
грамматические, 273 
интерполяция на этапе поиска, 270 
опережающие проверки, 260 
определение утверждений, 281 
приемы программирования, 657 


Томас ЛИМОНЧЕЛЛИ, Кристина ХОГАН, Страта ЧЕЙЛАП 


Системное и сетевое администрирование 
Практическое руководство, 2-е издание 
944 стр., книга в продаже 


Эта книга совсем не похожа на другие книги по системному адми- 
нистрированию. Вы не узнаете из нее, как управлять той или иной 
системой, однако она незаменима для тех, кто желает стать профес- 
сиональным и эффективным системным администратором. 

Книга содержит основную информацию о системах, сетях, 
серверах и вычислительных центрах, базовые и «продвинутые» 
принципы администрирования и разработки проектов вне зависи- 
мости от специфики операционной системы. Обсуждаются задачи, 
стоящие перед системными администраторами, и наиболее часто 
встречающиеся проблемы и эффективные способы их решения. 
Издание призвано стать настоящим наставником для новичков 
и отличным справочником для продвинутых админов. 

Нетехническим руководителям, в чьем подчинении находятся 
П-олделы, эта книга поможет лучше понять специфику работы их 
подчиненных. Главы, посвященные менеджменту, помогут руково- 
дителям ІТ-отделов повысить эффективность их работы, а также 
будут интересны всем, кто желает сделать карьеру в данной сфере. 
Повествование сопровождается множеством ярких примеров из 
жизни, а юмор авторов делает его живым и увлекательным. 


Арнольд РОББИНС, Элберт ХАННА, Линда ЛЭМБ 
Изучаем редакторы м и Міт, 7-е издание 


512 стр., книга в продаже 


Редакторы іі и Ит - это работа с текстом на. максимальной ско- 
рости и мощности. На протяжении 30 лет 2 оставался стандартом 
для ОМІХ и пих, а данное издание – основным пособием по 1/. 
Однако сейчас ОМХ уже не тот, что 30 лет назад, и седьмое из- 
дание расширено и включает подробное описание іт - самого 
популярного клона #%. Будучи редактором по умолчанию в боль- 
шинстве систем пих и в Мас 0$ Х, Мт также доступен во многих редакторы 
других ОС. Книга знакомит как с основами редактирования текста, ды 
таки с продвинутыми средствами, такими как интерактивные макро- 
сы и скрипты, расширяющие возможности редактора. 

Доступный стиль изложения сделал эту книгу классикой, и она 
незаменима, поскольку знание #4 или Міт - обязательное условие, 
если вы работаете в Цпих или ОМХ. Вы узнаете, как быстро пере- 
мещаться в 1% как выйти за рамки его основ, например, используя 
буферы, как применять глобальную функцию поиска и замены 1% 
как настроить редактор и как запускать команды ОМХ. Вы научи- 
тесь использовать расширенные текстовые объекты Уйт и мощные 
регулярные выражения, редактировать в нескольких окнах и писать 
скрипты в М т, использовать все возможности графической версии 
Мт - рит, применять такие усовершенствования Міт, как подсветка 
синтаксиса и расширенные теги. 


Изучаем 


выражения 


энер уче 


Ян ГОЙВЕРТС, Стивен ЛЕВИТАН 


Регулярные выражения 
Сборник рецептов 
608 стр., книгг в продаже 


Сборник содержит более 100 рецептов. которые помогут научить- 
ся эффективно оперировать данными и текстом с применением 
регулярных выражений. Книга знакомит читателя с функциями, 
синтаксисом и особенностями этого важного инструмента в различ- 
ных языках программирования: С*, Јауа, ]ауа5сире, Рей, РНР, Ругћоп, 
Киру и УВ.МЕТ. Предлагаются пошаговые решения наиболее часто 
встречающихся задач: работа с адресами ОВГ и путями в файловой 
системе, проверка и форматирование ввода пользователя, обработ- 
ка текста, а также обмен данными и работа с текстами в форматах 
НТМІ, ХМЕ. СЅУ и др. 

Данное руководство поможет как начинающему, так и уже 
опытному специалисту расширить свои знания о регулярных вы- 
ражениях, познакомиться с новыми приемами, узнать все тонкости 
работы с ними, научиться избегать ловушек и ложных совпадений. 
Освоив материал книги, вы сможете полнее использовать все те воз- 
можности, которые предоставляет умелое применєние регулярных 
выражений, и тем самым сэкономите свое время. 


Джеффри ФРИДЛ 
Регулярные выражения, 
3-е издание 
608 стр., книга в продаже 


Эта книга откроет перед вами секрет высокой производительности. 
Тщательно продуманные регулярные выражения помогут избежать 
долгих часов утомительной работы и решить свои проблемы за 
15 секунд. Ставшие стандартной возможностью во многих языках 
программирования и популярных программных продуктах, вклю- 
чая Рей, РНР, Јауа, Рушоп, Кобу, МУуЗОГ, УВ.МЕТ, Сғ (и другие языки 
платформы .М№ЕТ), регулярные выражения позволят вам автомати- 
зировать сложную и тонкую обработку текста. 

Написанное простым и доступным языком, это издание позволит 
программистам легко разобраться в столь сложной теме. Рассма- 
тривается принцип действия механизма регулярных выражений, 
сравниваются функциональные возможности различных языков 
программирования и инструментальных средств, подробно обсуж- 
дается оптимизация, которая дает основную экономию времени! 
Вы научитесь правильно конструировать регулярные выражения 
для самых разных ситуаций, а большое число сложных примеров 
даст возможность сразу же использовать предлагаемые ответы для 
выработки элегантных и экономичных практических решений 
широкого круга проблем. 


® 
УХ ХИ) 


Джон ЭРИКСОН 
Хакинг: искусство эксплойта, 2-е издание 


512 стр., книга в продаже 


Хакинг - это искусство творческого решения задач, подразумеваю- 
щее нестандартный подход ксложным проблемам и использование 
уязвимостей программ. 

Автор не учит нрименять известные эксплойты, а объясняет 
их работу и внутреннюю сущность. Вначале читатель знакомится 
с основами программирования на С, ассемблере и языке команд- 
ной оболочки, учится исследовать регистры процессора. А усвоив 
материал, можно приступать к хагингу ~ перезаписывать память 
с помощью переполнения буфера, получать доступ к удаленному 
серверу, скрывая свое присутствие, и перехватывать соединения 
ТСР. Изучив эти методы, можно взламывать зашифрованный тра- 
фик беспроводных сетей, успешно преодолевая системы защиты 
и обнаружения вторжений. 

Книга дает полное представление о программировании, машин- 
ной архитектуре, сетевых соединениях и хакерских приемах. Сэти- 
ми знаниями ваши возможности ограничены только воображением. 
Материалы для работы с этим изданием имеются в виде загрузочного 
диска ОБип пих, который можно скачать и использовать, не за- 
трагивая установленную на компьютере ОС. 


Дэвид БЛАНК-ЭДЕЛЬМАН 
Рем для системного администрирования 


496 стр., книга в продаже 


Рей позволяет быстро создавать эффективные сценарии для ав- 
томатизации многих административных задач. Этот модульный 
и мощный язык прекрасно приспособлен для управления системами 
на разных платформах. Книга будет полезна администраторам лю- 
бого уровня и написана для нескольких платформ (ОМІХ, \Лп90\5 
МТ, МасО$). 

Вы узнаете, как Рей! может улучшить производительность во є 
многих областях, включая: работу сучетными записями пользовате- ра 
лей, наблюдение за файловой системой и отслеживание процессов, 
работу с сетевыми службами имен (№15 и №), администрирование 
баз данных при помощи ОВГи ОРВС работу со службами каталогов 
(ІРАР и АР-$1), обработку и анализ файлов журналов регистрации, 
поддержку защищенной сети, использование $ММР для наблюдения 
за удаленными устройствами. 


Аллигатор ДЕКАРТ и Тим БАНС 
Программирование на Рей ОВ 
400 стр., книга в продаже 


Данная книга будет полезна как новичкам, которые найдут в ней 
описание архитектуры ОВГи подробные инструкции по написанию 
программ с помощью БЕ! так и знатокам, которым предназначено 
описание тонкостей использования ОВ! и специфических особен- 
ностей отдельных драйверов ОВО. 

ОН является основным интерфейсом программирования баз 
данных на Реп. Любая программа, использующая ОЕ, может рабо- 
тать с любой базой данных или даже одновременно с несколькими 
базами данных различных фирм, такими как Огас]е, Ѕубаѕе, Іпргеѕ, 
Іпѓогтіх, МубОГ, Ассеѕѕ и другие. 

Издание содержит полный справочник по "”ВІ. Предполагается, 
что читатель имеет базовые навыки программирования на Рей и 
может писать простые сценарии. 


Скот: ГУЛИЧ, Шишир ГУНДАВАРАМ, Гюнтер БИРЗНЕКС 


ССІ-программирование на Рен, 
2-е издание 


480 стр.. книга в продаже 


Эта книга - отличное начало для тех, кто хочет научиться писать 
ССІ-программы, обеспечивающие вывод динамически изменяемых 
данных на веб-сайте, и уже немного знаком с языком Регі, пользую- 
щимся большой популярностью среди веб-разработчиков. 

В книге приводятся примеры создания высокопроизводитель- 
ных и безопасных ССІ-приложений, подробно описывается мо- 
дуль ССІ.рт, дан обзор протокола НТТР, обсуждается применение 
ЈағаЅсгірі для обработки форм, работа с базами данных, вывод 
динамической графики, создание поисковой системы и системы 
на основе ХМІ, а также многое другое. 

Данное издание будет прекрасным руководством и незаменимым 
справочником. Содержащийся в нем материал позволит вам стать 
хорошим СС1-разработчиком. 


Рэндал ШВАРЦ, Том ФЕНИКС и брайан д фой 
Изучаем Рем, 5-е издание 


384 стр., книга в продаже Илучаесм 

Знакомство многих программистов сязыком Регі начинается с книги Реп 
«Іеагпіпр Рей», известной под названием «Лама-бук». Этот учебник 
стал настоящим бестселлером: впервые опубликованный в 1993 году, 
сейчас он вышел уже в пятом издании, описывающем последние 
изменения в языке вплоть до версии Рей 5.10 включительно! 

Книга обстоятельно, без спешки знакомит читателя с языком, 
который является «рабочей лошадкой» Интернета и которому отдают 
предпочтение системные администраторы, веб-хакеры и рядовыс 
программисты по всему миру. Каждая глава невелика, чтобы ее Бана 
можно было прочитать за час-два, и завершается упражнениями, 
позволяющими потренироваться в практическом применении ма- 
териала. Если вы желаете с пользой потратить первые 30-45 часов 
программирования на Ре! - книга незаменима. 


Рэндал ШВАРЦ, брайан д фой и Том ФЕНИКС 
Реп: изучаем глубже, 3-е издание 
книга готовится к изданию 


Данная книга продолжает обсуждение тем с того места, где оно 
было закончено в книге «Изучаем Рег. Вы научитесь писать ко- 
роткие сценарии и большие программы, используя возможности 
многоцелевого языка Реті. Книга познакомит вас с модулями, слож- 
ными структурами данных и основами объектно-ориентированного 
программирования. Третье издание охватывает самые последние 
изменения в языке Рей вплоть до версии 5.14. 

Каждая глава настолько маленькая, что ее можно прочитать за 
час-другой, и заканчивается серией упражнений, которые помогут 
вам на практических примерах закрепить только что прочитанный 
материал. Если вы уже прочли книгу «Изучаем Реп» и горите желани- 
ем двигаться дальше, данная книга поможет вам освоить основные 
базовые понятия языка Рей, необходимые для создания надежных 
программ для любых платформ. 

Среди рассматриваемых тем: пакеты и пространства имен, 
ссылки и области видимости, включая ссылки на регулярные вы- 
ражения, управление сложными структурами данных, объектно- 
ориентированное программирование, создание и использование 
модулей, тестирование программного кода на языке Реті, передача 
собственных модулей в СРАМ. 


Издательство “СИМВОЛ-ПЛЮС” 


Основано в 1995 году ® фо о фооооооооооооФо 


О нас Наша специализация - книги компьютерной и деловой тематики. 
Наши издания - плод сотрудничества известных зарубежных 
и отечественных авторов, высококлассных переводчиков 
и компетентных научных редакторов. Среди наших деловых 
партнеров издательства: О’КеШу, Реагзоп ЕдисаНоп, МемКійет5, 
Аааіѕоп МеѕІеу, УЛеу, МсСгам-НШ, № $тагсВ Ргеѕѕ, Раскі, Оогѕеѓ 
Ноџѕе, Аргеѕѕ и другие. 


А 
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